وكلاء كلود قاموا للتو ببناء مترجم C يعمل بكامل طاقته

ستة عشر من عملاء الذكاء الاصطناعي المستقلين. اسبوعين من التنفيذ المتواصل. ما يقرب من 100000 سطر من كود Rust. هذا ما تطلبه الأمر من Anthropic لبناء مترجم C قادر على تجميع مشاريع كبيرة في العالم الحقيقي مثل Linux kernel. ومع ذلك، هناك كيكر هنا. المشروع، الذي يُشار إليه داخليًا باسم “فرق الوكلاء” لكلود، لم يُكتب بواسطة فريق هندسة بشرية. تم تطويره بواسطة سرب منسق من عملاء كلود الذين يعملون بالتوازي، تقريبًا بدون تدخل بشري.
ولكن عليك أن تعلم أن هذا لم يكن إكمالًا تلقائيًا على المنشطات أو أن برنامج الدردشة الآلي يجمع وظائف عشوائية معًا. عمل وكلاء كلود كفريق هندسي حقيقي، حيث قاموا بتقسيم المترجم إلى وحدات، وتعيين المسؤوليات، وكتابة المكونات، وتشغيل مجموعات الاختبار، وإصلاح الأخطاء، والتكرار بشكل مستمر. وهذا ما يجعل هذا معلمًا رئيسيًا في عصر تطوير الذكاء الاصطناعي (تعلم الذكاء الاصطناعي مجانًا). ما حدث، ومدى أهميته، دعونا نستكشفه في هذه المقالة.
TL;DR
شاهد هذا الفيديو بدلاً من ذلك:
ما بني الأنثروبي
في جوهره، شرع مشروع Anthropic في إنشاء مترجم لغة C كامل من الصفر، ولكن *انتظر*، باستخدام عوامل الذكاء الاصطناعي فقط. لم يكن هذا مترجمًا للعبة أو عرضًا توضيحيًا للفصل الدراسي. كان هذا مترجمًا حقيقيًا قادرًا على التعامل مع أعباء العمل على مستوى الإنتاج. تمت كتابة مترجم Claude C بلغة Rust وتم تصميمه لترجمة برامج C إلى تعليمات برمجية قابلة للتنفيذ عبر البنى الأساسية مثل x86-64 وARM.
ولم يتم اختبار ذلك على برامج “Hello World” البسيطة. لقد تم دفعه بقوة. نجح المترجم في التعامل مع قواعد التعليمات البرمجية الكبيرة والمعقدة مثل Linux kernel وغيرها من المشاريع مفتوحة المصدر المستخدمة على نطاق واسع. لقد اجتاز أيضًا جزءًا كبيرًا من مجموعة اختبارات التعذيب الخاصة بدول مجلس التعاون الخليجي، وهي عبارة عن مجموعة وحشية من الحالات المتطورة المصممة لكسر مجمعي لغة C. وهذا ما يجعل هذا الإنجاز مثيرًا للإعجاب للغاية. بناء شيء ناجح هو شيء واحد. إن بناء شيء ينجو من اختبارات التحمل التي يستخدمها مهندسو المترجمات المحترفون هو شيء آخر.
كيف فعلت الأنثروبي ذلك؟
إذًا كيف يمكنك جعل عملاء الذكاء الاصطناعي يبنون شيئًا معقدًا مثل مترجم لغة C؟
كان المفتاح هو عدم الاعتماد على نموذج واحد يعمل في حلقة. وبدلاً من ذلك، قاموا بنشر فريق من 16 عميلاً لكلود يعملون بالتوازي. فكر في الأمر مثل إنشاء فريق هندسي صغير، باستثناء أن كل مهندس هو مثال للذكاء الاصطناعي. تم تكليف كل وكيل بمهام منظمة وأهداف واضحة وإمكانية الوصول إلى قاعدة التعليمات البرمجية المشتركة. ثم قام هؤلاء الوكلاء بتنسيق تعليمات برمجية محددة للغاية لإنشاء مترجم C فعال ومزدهر.
كان التنسيق ركيزة أخرى. ولهذا السبب، قامت Anthropic ببناء أداة تسخير حول الوكلاء – بيئة خاضعة للرقابة حيث يمكنهم كتابة التعليمات البرمجية، وإجراء الاختبارات، ورؤية حالات الفشل، وإصلاح المشكلات، والتكرار. لذلك، كلما انكسر شيء ما، لم يتوقف العملاء. لقد قاموا بتصحيح الأخطاء بدلاً من ذلك. وعندما فشلت الاختبارات، قاموا بمراجعتها. تعمل حلقة التغذية الراجعة المستمرة هذه كنظام مدمج لمراقبة الجودة.
كما أحدث التوازي فرقًا كبيرًا. بينما كان أحد الوكلاء يعمل على تحليل المنطق، كان بإمكان وكيل آخر التعامل مع إنشاء التعليمات البرمجية، بينما ركز آخرون على التحسين أو إصلاحات الأخطاء. فبدلاً من التقدم الخطي، حدث التطور في وقت واحد عبر جبهات متعددة، مما أدى إلى تسريع العملية بشكل كبير.
لم يكن هذا السحر. لقد كان استقلالًا منظمًا.
لماذا هذه صفقة كبيرة
يقع المترجمون في أساس الحوسبة. كل تطبيق تستخدمه، كل نظام تشغيل، كل خدمة خلفية، في مرحلة ما، يمر عبر مترجم. يعتبر بناء واحد منها عملاً جادًا في مجال هندسة الأنظمة، وهي مهمة للمطورين ذوي أعلى المهارات. يتطلب الأمر فهمًا عميقًا لتصميم اللغة، وإدارة الذاكرة، واستراتيجيات التحسين، والاختلافات في البنية، وعدد لا يحصى من حالات الحافة.
لذا، عندما يقوم عملاء الذكاء الاصطناعي ببناء مترجم لغة C عامل في أسابيع، فإن ذلك يشير إلى تحول هائل.
حتى وقت قريب، كانت أدوات تشفير الذكاء الاصطناعي (راجع أفضل 10 هنا) بمثابة أدوات مساعدة. كحد أقصى، ساعدوا المطورين في كتابة الوظائف، أو إعادة البناء المقترحة، أو إنشاء نموذج معياري. لكن هذا المشروع هو الدليل الحقيقي على أن الذكاء الاصطناعي يمكنه التعامل مع المهام الهندسية متعددة المراحل وعالية التعقيد من خلال التكرار والاختبار المنظم.
بالتفكير في الأمر، هذا يمكن أن يغير تطوير البرمجيات كما نعرفها.
بدلاً من السؤال، “هل يمكن للذكاء الاصطناعي مساعدتي في كتابة هذه الوظيفة؟” ويصبح السؤال الجديد هو: “هل يستطيع الذكاء الاصطناعي تنسيق وتنفيذ بناء نظام كامل؟” وإذا كان المترجمون ممكنين، فإن الاحتمالات تمتد الآن إلى قواعد البيانات، وأنظمة التشغيل، وحتى أدوات المؤسسات واسعة النطاق.
ما لا يزال غير قادر على فعله (حتى الآن)
بقدر ما هو مثير للإعجاب، فإن برنامج Claude C Compiler لن يحل محل مجلس التعاون الخليجي أو Clang في أي وقت قريب. لماذا؟
بالنسبة للمبتدئين، فهو ليس مترجمًا ناضجًا تمامًا على مستوى الإنتاج. على الرغم من نجاحه في تجميع نواة Linux واجتياز العديد من اختبارات التحمل، إلا أنه لا يدعم حتى الآن كل حالة حافة أو اختلاف في البنية التي يتعامل معها المترجمون منذ عقود. لا تزال بعض الميزات ذات المستوى المنخفض، مثل بعض سلوكيات x86 القديمة، محدودة. ويعتمد أيضًا على الأدوات الموجودة لأجزاء من سلسلة الأدوات، مثل التجميع والربط.
تحسين الأداء هو مجال آخر. لقد مر المترجمون الراسخون بسنوات، أو حتى عقود، من التحسين. وبالتالي فإنهم يضغطون على كل جزء من الكفاءة. يعمل المترجم الذي صممه كلود، ولكن ليس بالضرورة أن يتم تحسينه على هذا المستوى.
ولكن هذا ما يرام.
النقطة في اختبار الأنثروبيك ليست الكمال. كان الهدف هو التحقق مما إذا كان ذلك ممكنًا على الإطلاق. ما نراه هنا هو أن الأنظمة الذاتية في مراحلها المبكرة تتعامل بالفعل مع مهام البنية التحتية التقنية العميقة. إذا كان هذا هو الإصدار الأول، فلا يمكننا إلا أن نتخيل ما يمكن أن يفعله الإصدار الخامس.
وهنا تصبح الأمور مثيرة للاهتمام.
ماذا يأتي بعد ذلك؟
وفي ملاحظاته الختامية داخل المدونة، يقول نيكولاس كارليني، مؤلف التجربة والباحث في فريق Anthropic’s Safeguards، إنه في حين أن التجربة ونتائجها تثير اهتمامه، فإنها تجعله أيضًا يشعر “بالقلق”. وهو يسلط الضوء على كيفية اتباع استخدام الذكاء الاصطناعي لأغراض التطوير حتى الآن إجراءً شائعًا واحدًا – حيث يحدد المستخدم مهمة، ويكملها ماجستير إدارة الأعمال، ثم يعود للحصول على إجابة.
إن التطور المستقل تمامًا من قبل عملاء كلود يغير ذلك.
فكر في الأمر بهذه الطريقة – القصة الحقيقية هنا ليست مجرد أن الذكاء الاصطناعي قام ببناء مترجم. إن الذكاء الاصطناعي هو الذي أدار مشروعًا هندسيًا معقدًا وطويل الأمد ذو هيكل وتكرار وتنسيق. وكانت النتيجة مترجم C قويًا وفعالًا.
اليوم، هو مترجم C. وغدًا، يمكن أن تكون أنظمة خلفية كاملة، أو بنية تحتية موزعة، أو محركات محاكاة، أو لغات خاصة بالمجال. بمجرد إثبات أن الوكلاء يمكنهم التعاون، واختبار أنفسهم، وإصلاح الإخفاقات، ومواصلة التقدم دون إشراف بشري مستمر، فإن النطاق يتوسع بسرعة، وأجرؤ على القول، إلى ما لا نهاية.
يسلط كارليني الضوء على تهديد حقيقي هنا. ويقول إنه “من السهل رؤية اجتياز الاختبارات وافتراض إنجاز المهمة” عندما تكون هذه الأنظمة المستقلة في العمل. لكن هذا نادرًا ما يكون هو الحال، وفي أغلب الأحيان، توجد نقاط ضعف في مثل هذه الأنظمة تحتاج إلى التحقق من قبل البشر، قبل تفعيل أي برنامج من هذا القبيل.
لذا، فبينما تُظهر التجربة أفقاً جديداً تماماً من الاحتمالات، يتعين علينا أن نتعامل بحذر مع كيفية تطبيقها في المستقبل.
خاتمة
بالنسبة للمطورين، يجب أن أقول هذا – من فضلك لا تفكر في هذا التطوير على أنه “انتهت اللعبة”. هذا يعني ببساطة أن دورك كمطور يتطور الآن. بدلاً من كتابة كل سطر، يمكنك تصميم النظام بشكل متزايد، وتحديد القيود، وبناء أدوات التقييم، والإشراف على فرق الوكلاء. والأهم من ذلك، أنه سيتعين عليك بالتأكيد التحقق من نقاط الضعف في هذه الأنظمة. يُظهر لنا مترجم Claude C، الذي أنشأه وكلاؤه، معاينة لهذا المستقبل.
لم يعد الذكاء الاصطناعي يساعد فقط في كتابة التعليمات البرمجية. لقد بدأ في بناء الأنظمة. وهذا دوري مختلف تمامًا.
قم بتسجيل الدخول لمواصلة القراءة والاستمتاع بالمحتوى الذي ينظمه الخبراء.
Source link



