كيفية الوصول إلى Qwen3-Coder-Next واستخدامه؟

لقد ركزت التطورات الأخيرة في نماذج الذكاء الاصطناعي بشكل خاص على مهمة واحدة – وكلاء الترميز. وبعد ذلك، خرجت الآن شركة Qwen التابعة لشركة Alibaba بنموذج جديد، يعد بنتائج رائدة في الصناعة، كل ذلك أثناء تشغيله محليًا. وهذا يجعله في الأساس نموذجًا لغويًا مفتوح الوزن مصممًا، على حد تعبير فريق Qwen، “خصيصًا لوكلاء البرمجة والتطوير المحلي”. أما بالنسبة لللقب، فقد أطلق قسم الذكاء الاصطناعي في علي بابا على النموذج الجديد اسم Qwen3-Coder-Next.
إذًا ما الذي يجعل النموذج الجديد مختلفًا؟ من خلال مشاركة تلميح حول هذا الأمر في إحدى المدونات، يذكر فريق Qwen على وجه التحديد أن Qwen3-Coder-Next “تم تدريبه على نطاق واسع على توليف المهام القابلة للتنفيذ على نطاق واسع، والتفاعل مع البيئة، والتعلم المعزز”. وبسبب هذا التدريب، يُقال إن Qwen3-Coder-Next يأتي مزودًا “بقدرات ترميزية ووكيلية قوية”، كل ذلك مع تكبد “تكاليف استدلال أقل بكثير”.
ما مدى التحسن الذي حدث في حالات الاستخدام في العالم الحقيقي؟ دعونا معرفة في هذا المقال.
ما هو Qwen3-Coder-Next؟
كما ذكرنا سابقًا، Qwen3-Coder-Next هو نموذج لغة مفتوح الوزن، مما يعني أن معلماته المدربة (أوزانه) يتم إصدارها للعامة، ويمكن لأي شخص تنزيله وتشغيله وضبطه محليًا (اقرأ المزيد عن نماذج الوزن المفتوح هنا). في جوهره، تم تصميم Qwen3-Coder-Next ليعمل بشكل أقل شبهاً ببرنامج الدردشة الآلي وأكثر كوكيل برمجيات حقيقي. بدلاً من مجرد توقع السطر التالي من التعليمات البرمجية، يتم تدريبه على فهم أهدافك، والتفاعل مع بيئات التنفيذ، والتكرار نحو حلول العمل. على الرغم من أن هذا قد لا يبدو كثيرًا بالنسبة لك، إلا أن هذا التمييز مهم جدًا.
من أهم ما يميز النموذج هو أنه مصمم خصيصًا لسير العمل الوكيل. وهذا يعني أن Qwen3-Coder-Next يمكنه تخطيط مهام متعددة الخطوات، والتفكير في الملفات الطويلة، وتشغيل التعليمات البرمجية، ومراقبة المخرجات، وضبط نهجها. بالتفكير في الأمر، هذه هي بالضبط الطريقة التي يعمل بها المطورون البشريون.
هناك نقطة رئيسية أخرى وهي النشر. تم تصميم Qwen3-Coder-Next للتشغيل محليًا، مما يمنح المطورين التحكم الكامل في البيئة والبيانات وسير العمل. وهذا يجعلها جذابة بشكل خاص للفرق التي تعمل على قواعد التعليمات البرمجية الخاصة، أو الأدوات الداخلية، أو الإعدادات غير المتصلة بالإنترنت، دون التضحية بالإمكانات.
باختصار، هذا ليس مجرد نموذج “اكتب لي دالة”. Qwen3-Coder-Next هي محاولة Qwen لتحويل الذكاء الاصطناعي إلى وكيل ترميز عملي وقابل للتشغيل محليًا. واحد يمكنه التفكير والاختبار وتحسين مخرجاته.
Qwen3-Coder-الهندسة المعمارية التالية
في مدونته، حدد فريق Qwen أن Qwen3-Coder-Next “تم بناؤه على قمة Qwen3-Next-80B-A3B-Base”. وهذا يعني أنها ترث نفس الاهتمام المختلط وبنية MoE (خليط من الخبراء) التي تعمل على تشغيل أحدث جيل من الموديلات الكبيرة من Qwen.
يعد تصميم الاهتمام المختلط هذا من بين أفضل التقنيات لتحقيق التوازن بين فهم السياق الطويل والحساب الفعال. مما يعني أنه بدلاً من تطبيق الاهتمام الكامل في كل مكان، فإنه يخصص الاهتمام بشكل انتقائي حيث يكون أكثر أهمية. يعد هذا مهمًا بشكل خاص لمهام البرمجة، حيث يجب على النموذج التفكير عبر الملفات الكبيرة والتبعيات وسجلات التنفيذ دون إتلاف الذاكرة أو زمن الوصول.
ويعمل إعداد وزارة التربية على زيادة حدة هذه الكفاءة. بدلاً من تنشيط النموذج بأكمله لكل رمز مميز، يقوم Qwen3-Coder-Next بتوجيه المهام ديناميكيًا إلى مجموعة فرعية صغيرة من “الخبراء” المتخصصين. من الناحية العملية، هذا يعني أنك تحصل على فوائد نموذج كبير جدًا، لكنك تدفع فقط تكلفة حساب نموذج أصغر بكثير أثناء الاستدلال.
الآن دعونا نعود إلى الكفاءتين الأساسيتين لـ Qwen3-Coder-Next. يمكن للنموذج أن يدعم سير عمل الترميز الوكيل على نطاق واسع، في حين يظل عمليًا بدرجة كافية للتشغيل محليًا. ومن الواضح أن هذا لا يمكن تحقيقه إلا من خلال هذه الاختيارات المعمارية.
والآن بعد أن عرفنا كيفية بنائها، دعونا نتحقق من أدائها وفقًا للنتائج المرجعية.
Qwen3-Coder-الأداء المعياري التالي
استنادًا إلى المعايير الرسمية (اقرأ المزيد عن معايير الذكاء الاصطناعي هنا) التي شاركها فريق Qwen، إليك كيفية أداء Qwen3-Coder-Next عبر تقييمات وكيل الترميز المستخدمة على نطاق واسع:
- تم التحقق من SWE-Bench (مع وكيل SWE): معدل نجاح 70.6%
- SWE-Bench Multilingual (مع وكيل SWE): نسبة نجاح 62.8%
- SWE-Bench Pro (مع وكيل SWE): معدل نجاح 44.3%
- Terminal-Bench 2.0 (مع Terminus-2 JSON): معدل نجاح 36.2%
- معيار Aider: نسبة النجاح 66.2%
ماذا تخبرنا هذه النتائج
يثبت الأداء المتميز في SWE-Bench Verified أن Qwen3-Coder-Next فعال للغاية في مهام صيانة البرامج في العالم الحقيقي، خاصة تلك التي تتضمن إصلاح الأخطاء والتفكير المنطقي على مستوى المستودع. يعكس هذا المعيار بشكل وثيق ما يواجهه المطورون في قواعد تعليمات الإنتاج، مما يجعل هذه النتيجة ذات معنى خاص.
يسلط عرضه القوي على SWE-Bench Multilingual الضوء على قوة رئيسية أخرى: النموذج لا يقتصر على سياقات التعليمات البرمجية باللغة الإنجليزية فقط. يمكنه التفكير عبر المستودعات والتعليقات والوثائق متعددة اللغات، وعدم فقدان اتساقها. وهذا مطلب متزايد الأهمية لفرق التطوير العالمية.
تعزز نتيجة SWE-Bench Pro أيضًا أن هذا النموذج مصمم لعمق الوكيل، في حين تشير نتائج Terminal-Bench 2.0 إلى تفكير موثوق به في سطر الأوامر وتفاعل منظم للأداة. وأخيرًا، يُظهر الأداء القوي لـ Aider، وهو معيار يركز على سير عمل الترميز بمساعدة الذكاء الاصطناعي، أن Qwen3-Coder-Next يتكامل بشكل جيد مع أدوات المطورين الحقيقية.
إذا أردنا تلخيص هذا الأداء المعياري، فمن الواضح أن نموذج Qwen الجديد مُحسّن لوكلاء الترميز العمليين. يعكس أدائها باستمرار القدرة على التخطيط والتصرف والملاحظة والتكرار. وهذا هو بالضبط ما تتطلبه مسارات عمل التطوير الحديثة المدعومة بالذكاء الاصطناعي.
Qwen3-Coder-Next: كيفية الوصول
هناك 3 طرق يمكنك من خلالها الوصول إلى Qwen3-Coder-Next الجديد، بناءً على النظام الأساسي الذي تريده –
معانقة الوجه – https://huggingface.co/collections/Qwen/qwen3-coder-next
كاجل – https://www.kaggle.com/models/qwen-lm/qwen3-coder-next
موديلسكوب – https://modelscope.cn/collections/Qwen/Qwen3-Coder-Next
التدريب العملي على Qwen3-Coder-Next
لاختبار براعة أحدث طراز من طراز Qwen، قمنا بإخضاعه لبعض الاختبارات الواقعية. لقد شاركنا المطالبات التالية معها للتحقق من المخرجات، وهذا ما حصلنا عليه.
1. لعبة الثعبان
اِسْتَدْعَى:
إنشاء لعبة ثعبان بسيطة. قم بتضمين نقاط إضافية بينهما مما يؤدي إلى نمو الثعبان بمقدار 3 نقاط بدلاً من 1
الإخراج:
Snake Game - Bonus Mode
Normal (+1)
Bonus (+3)
Use Arrow Keys to move
تمكن Qwen3-Coder-Next من إنشاء هذا الكود بالكامل خلال جزء من الثانية. وبعد اختباره، وجدت أنه يعمل بشكل مثالي، حتى مع التعليمات الخاصة بالنقاط الإضافية التي تعمل على نمو الثعبان بشكل غير متناسب. تفضل، جرب مطالبة كهذه وستندهش من سرعة النموذج ودقته.
2. كود HTML للرسوم المتحركة البسيطة
اِسْتَدْعَى:
أعطني رمز HTML لدائرة تدور داخل مربع، وهي داخل مثلث. تدور الكرة والمثلث في اتجاه واحد والمربع في الاتجاه المعاكس.
الإخراج:
Rotating Geometric Shapes
مرة أخرى، توصل Qwen3-Coder-Next إلى رمز للمهمة المطروحة بسرعة البرق. يصور بدقة الأشكال ودورانها. التغيير البسيط الوحيد الذي كنت أريده هنا هو أن تكون الأشكال بالكامل داخل الشكل الخارجي، بدلاً من ترتيب النصف للداخل ونصف للخارج كما هو موضح هنا. بخلاف ذلك، قام نموذج الذكاء الاصطناعي بذلك بشكل رائع.
3. موقع HTML الأساسي
اِسْتَدْعَى:
أنشئ موقعًا إلكترونيًا أساسيًا بتنسيق HTML لشركة سياحية، يُدرج فيه العروض الخاصة بالوجهات السياحية الشهيرة في الهند. أضف فئة أخرى تعرض أنشطة المغامرة كحزم. احتفظ برأسية تحتوي على شعار والقائمة النموذجية لموقع الويب. حافظ على موضوع اللون الأزرق والأبيض.
الإخراج:
India Travels | Explore the Pink & Blue Country
From the majestic Himalayas to the serene backwaters of Kerala, experience the colors, culture, and chaos of the subcontinent.
Explore Packages
Northern Circuit
The Golden Triangle
Delhi, Agra, and Jaipur. Explore Mughal architecture, fortresses, and the vibrant bazaars of Rajasthan.
7 Days
4 Cities
Hotel Included
$350
الساحل الغربي
شاطئ جوا وجولة الحفلة
يمكنك الاسترخاء على الشواطئ المشمسة وتجربة الحياة الليلية النابضة بالحياة والاستمتاع بالرياضات المائية في جنوب جوا وشمال جوا.
5 أيام
منتجعات الشاطئ
الأطراف متضمنة
280 دولارًا
الهدوء الجنوبي
المناطق النائية والحياة البرية في ولاية كيرالا
استمتع برحلة بحرية على متن قوارب منزلية في أليبي، وقم بزيارة مزارع التوابل، وشاهد النمور في محمية بيريار للحياة البرية.
6 أيام
إقامة المركب
جولات التوابل
420 دولارًا
بنجي والنهر
مخيم ريشيكيش للمغامرات
القفز بالحبال، وركوب الرمث في النهر، وتسلق الصخور في عاصمة اليوغا في العالم، والتي تقع في جبال الهيمالايا.
2 أيام
إقامة المخيم
معدات احترافية
120 دولارًا
ارتفاع عال
سفاري دراجة لاداخ
قم بالقيادة عبر أعلى الطرق الآلية في العالم، واعبر ممر شينجا لا، وشاهد بحيرة بانجونج البكر.
8 أيام
دراجة ذاتية القيادة
دليل المدرجة
600 دولار
سفاري الصحراء
مخيم ثار الصحراوي (جايسالمر)
ركوب الجمال عند غروب الشمس، وعشاء راجاستان التقليدي تحت النجوم، والنوم في مخيمات فاخرة.
1 يوم
ركوب الجمل
العشاء والرقص
80 دولارًا
يعد هذا أحد أفضل مواقع الويب المبرمجة بالذكاء الاصطناعي التي رأيتها حتى الآن. إنه يميل إلى أن يكون كل شيء في مكانه الصحيح، مع تصوير دقيق لجميع التعليمات بالإضافة إلى العناصر التي لم أحددها حقًا. نظام الألوان على النقطة. تم تصميم المسافات والأقسام بشكل جيد، والنص مثالي للقراءة. هذا هو نوع الإخراج الذي يمكن أن يأخذك مباشرة من الموجه إلى البث المباشر، لذا أهنئ Qwen3-Coder-Next للحصول على إخراج فائق السرعة وشبه مثالي.
خاتمة
للوهلة الأولى، يقدم Qwen3-Coder-Next بعض الوعود الكبيرة – وكلاء البرمجة، والتفكير القوي، والقدرة على التشغيل محليًا بأقل تكلفة استدلال. ولكن بمجرد إلقاء نظرة على أدائه القياسي، ستعرف أن هذه ليست مجرد كلمات في الهواء. هذه مدعومة ببعض مقاييس الأداء الحقيقية للغاية.
وذلك عندما تشعر أن نموذج Qwen الجديد عملي بالفعل بدرجة كافية لسير عمل التطوير في العالم الحقيقي. ومع ذلك، فمن الواضح أن هذه ليست نهاية الطريق. في حين أن النموذج يؤدي أداءً تنافسيًا حتى في مواجهة أنظمة مفتوحة المصدر أكبر بكثير، فإن فريق Qwen صريح بشأن مجال التحسين. وأن الصدق مهم.
وبالنظر إلى المستقبل، ينصب تركيز كوين بشدة على تعزيز مهارات العميل: التفكير الأفضل، واستخدام الأدوات الأكثر ذكاءً، وتغطية المهام على نطاق أوسع. حتى أنه يعد بتحديثات سريعة بناءً على “كيفية استخدام الأشخاص له”. الآن هذا هو نوع الالتزام الذي تحتاجه من صانعي نموذج الذكاء الاصطناعي الرائع. وإذا استمر هذا المسار، فلن يكون من المستغرب أن يتطور Qwen3-Coder-Next من مساعد ترميز محلي قوي إلى وكيل برمجيات مستقل حقًا.
قم بتسجيل الدخول لمواصلة القراءة والاستمتاع بالمحتوى الذي ينظمه الخبراء.
Source link




