الذكاء الاصطناعي

الاختراق الذي تم التغاضي عنه للحصول على نتائج أفضل في LLM

هل سبق لك أن طرحت سؤالاً على ماجستير في القانون، وغيرت الصياغة عدة مرات، وما زلت تشعر أن الإجابة لم تكن صحيحة تمامًا؟ إذا كنت قد عملت باستخدام أدوات مثل ChatGPT أو Gemini، فمن المحتمل أنك أعدت كتابة المطالبات، أو أضفت المزيد من السياق، أو استخدمت عبارات مثل “كن موجزًا” أو “فكر خطوة بخطوة” لتحسين النتائج. ولكن ماذا لو كان تحسين الدقة أمرًا بسيطًا مثل نسخ المطالبة بالكامل ولصقها مرة أخرى؟ هذه هي الفكرة وراء التكرار السريع. قد يبدو الأمر بسيطًا جدًا، لكن الأبحاث تظهر أن إعطاء النموذج سؤالك مرتين يمكن أن يؤدي إلى تحسين الدقة بشكل كبير في العديد من المهام، مما يجعله أحد أسهل تعزيزات الأداء التي يمكنك تجربتها.

ما هو التكرار الفوري ولماذا نحاول ذلك؟

لفهم لماذا يساعد التكرار، نحن بحاجة إلى النظر في كيفية معالجة LLMs للنص. يتم تدريب معظم نماذج اللغة الكبيرة بطريقة سببية. إنهم يتنبأون بالرموز واحداً تلو الآخر، وكل رمز يمكن أن يعتني فقط بالرموز التي جاءت قبله. وهذا يعني أن ترتيب المعلومات في موجهك يمكن أن يؤثر على فهم النموذج.

يساعد التكرار الفوري على تقليل تأثير الطلب هذا. عند تكرار المطالبة، يحصل كل رمز مميز على فرصة أخرى لحضور جميع المعلومات ذات الصلة. بدلاً من رؤية السياق مرة واحدة، يقوم النموذج بمعالجته بشكل فعال مرتين أثناء مرحلة الإدخال (التعبئة المسبقة).

والأهم من ذلك أن هذا يحدث قبل أن يبدأ النموذج في توليد الإجابة. لا يتغير تنسيق الإخراج، ولا يقوم النموذج بإنشاء رموز إضافية. أنت ببساطة تقوم بتحسين كيفية معالجة النموذج للمدخلات.

اقرأ أيضًا: الدليل الهندسي الفوري 2026

التكرار الفوري في العمل

قامت الدراسة بتقييم التكرار السريع عبر 7 مهام مختلفة باستخدام 7 ماجستير في القانون. لم تكن هذه نماذج تجريبية صغيرة. وتضمنت نماذج مستخدمة على نطاق واسع مثل Gemini وGPT-4o وClaude وDeepSeek، والتي يمكن الوصول إليها من خلال واجهات برمجة التطبيقات الرسمية الخاصة بهم. وكانت المهام السبع عبارة عن:

خمسة معايير قياسية:

  • ARC (أسئلة الاستدلال العلمي)
  • OpenBookQA
  • GSM8K (المسائل اللفظية الرياضية)
  • MMLU-Pro (المعرفة متعددة المجالات)
  • الرياضيات

مهمتان مصممتان خصيصًا:

تم تصميم المهام المخصصة خصيصًا لاختبار مدى جودة تعامل النماذج مع المعلومات المنظمة والموضعية.

لكل مهمة، قارن الباحثون إعدادين:

  1. موجه خط الأساس
  2. بالضبط نفس المطالبة تكررت مرتين

ولم يتغير شيء آخر. ظل تنسيق الإخراج كما هو. لم يتم ضبط النموذج بدقة. والفرق الوحيد هو أن المدخلات كانت مكررة.

ثم قاموا بقياس:

  • دقة
  • طول الإخراج
  • كمون

دليل لمعايير الذكاء الاصطناعي التي تغطي كل ما يتعلق بـ MMLU وHumanEval والمزيد من الشرح

نتيجة تجربة التكرار الفوري

ومن خلال سبعين مقارنة شاملة تغطي نماذج ومعايير مختلفة، أدى التكرار السريع إلى تحسين الدقة سبعة وأربعين مرة. لم يقلل الأداء بشكل كبير. وكانت التحسينات ملحوظة بشكل خاص في تنسيقات الاختيار من متعدد وفي المهام المنظمة حيث يحتاج النموذج إلى تتبع المعلومات الموضعية بعناية.

مثال من الورقة: مهمة NameIndex

في مهمة NameIndex، يتم إعطاء النموذج قائمة تضم 50 اسمًا ويتم طرح سؤال مباشر عليه: “ما هو الاسم الخامس والعشرون؟” المهمة لا تتطلب المنطق أو التفسير. يتطلب فقط تتبعًا موضعيًا دقيقًا داخل القائمة.

في الإعداد الأساسي، كان الأداء منخفضا. على سبيل المثال، حقق Gemini 2.0 Flash Lite دقة تبلغ 21.33%. وبعد تطبيق التكرار السريع زادت الدقة إلى 97.33%. وهذا تحسن كبير في الموثوقية.

تتطلب فهرسة القائمة أن يقوم النموذج بتشفير التسلسل والموضع بشكل صحيح. عندما تظهر المطالبة مرة واحدة، يقوم النموذج بمعالجة القائمة والسؤال في مسار واحد. قد لا يتم تعزيز بعض العلاقات الموضعية بقوة. عند تكرار القائمة الكاملة والسؤال، يقوم النموذج بمعالجة البنية بشكل فعال مرتين قبل الإجابة. وهذا يعزز تمثيلها الداخلي للطلب.

ولكن ماذا عن زمن الوصول وتكاليف الرمز المميز؟

كلما قمنا بتحسين الدقة، يصبح السؤال التالي واضحًا: ما هي التكلفة؟ والمثير للدهشة أنه لا شيء تقريبًا.

هذه الأرقام تقارن:

  • دقة
  • متوسط ​​طول الاستجابة
  • متوسط ​​طول الاستجابة
  • كمون

النتيجة الرئيسية:

  • التكرار الفوري لا يزيد من طول الرمز المميز للإخراج.
  • النموذج لا يولد إجابات أطول.
  • يظل زمن الاستجابة أيضًا كما هو تقريبًا، باستثناء سيناريوهات المطالبة الطويلة جدًا (خاصة مع النماذج الإنسانية)، حيث تستغرق مرحلة التعبئة المسبقة وقتًا أطول قليلاً.

وهذا مهم في أنظمة الإنتاج.

على عكس تحفيز سلسلة الأفكار، الذي يزيد من توليد الرمز المميز والتكلفة، فإن التكرار الفوري يحول الحساب إلى مرحلة التعبئة المسبقة، وهي قابلة للتوازي.

في تطبيقات العالم الحقيقي:

  • التكلفة لكل طلب لا ترتفع
  • يظل تنسيق ردك متطابقًا
  • يظل منطق التحليل النهائي الخاص بك سليمًا

وهذا يجعلها سهلة النشر للغاية.

متى يعمل التكرار الفوري بشكل أفضل؟

التكرار الفوري لا يحل كل مشكلة بطريقة سحرية. يظهر البحث أنه أكثر فعالية في المهام غير المنطقية، خاصة عندما يجب على النموذج معالجة المعلومات المنظمة أو المرتبة بعناية.

يميل إلى العمل بشكل أفضل في سيناريوهات مثل:

  • الإجابة على أسئلة الاختيار من متعدد
  • المهام التي تنطوي على سياق طويل يتبعه سؤال قصير
  • قائمة مشاكل الفهرسة أو الاسترجاع
  • استخراج البيانات المنظمة
  • مهام التصنيف بمسميات محددة بوضوح

تكون التحسينات ملحوظة بشكل خاص عندما يجب على النموذج أن يتتبع المواضع أو العلاقات بشكل صحيح ضمن المدخلات المنظمة. تكرار المطالبة يعزز تلك العلاقات.

ومع ذلك، عندما يتم تمكين الاستدلال الواضح، مثل مطالبة النموذج “بالتفكير خطوة بخطوة”، تصبح الفوائد أقل. في هذه الحالات، يقوم النموذج غالبًا بإعادة صياغة أو إعادة معالجة أجزاء من السؤال أثناء التفكير على أي حال. لا يزال التكرار لا يضر بالأداء، لكن التحسن عادة ما يكون محايدًا وليس دراميًا.

الوجبات الجاهزة الرئيسية بسيطة. إذا كانت مهمتك لا تتطلب تفكيرًا طويلًا لسلسلة من الأفكار، فمن المحتمل أن يكون التكرار الفوري يستحق الاختبار.

كيفية تنفيذ التكرار الفوري في الممارسة العملية

التنفيذ واضح ومباشر. لا تحتاج إلى أدوات خاصة أو تغييرات في النموذج. يمكنك ببساطة تكرار سلسلة الإدخال قبل إرسالها إلى النموذج.

بدلاً من الإرسال:

prompt = query

قمت بإرسال:

prompt = query + "\n" + query

هذا هو التغيير كله.

هناك بعض الاعتبارات العملية. أولاً، تأكد من أن طول المطالبة لا يتجاوز نافذة سياق النموذج. قد يؤدي مضاعفة المطالبة الطويلة جدًا إلى دفعك إلى ما يقرب من الحد الأقصى. ثانيًا، اختبر التغيير في مهمتك المحددة. في حين تظهر الأبحاث مكاسب متسقة، فإن كل نظام إنتاج له خصائصه الخاصة.

فائدة هذا النهج هي أنه لا يوجد شيء آخر في نظامك يحتاج إلى التغيير. يظل تنسيق الإخراج الخاص بك كما هو. يظل منطق التحليل الخاص بك كما هو. يظل مسار التقييم الخاص بك كما هو. وهذا يجعل من السهل التجربة دون مخاطرة.

التكرار الفوري مقابل سلسلة الأفكار المحفزة

من المهم أن نفهم كيف يختلف التكرار الفوري عن تحفيز سلسلة الأفكار.

يشجع تحفيز سلسلة الأفكار النموذج على شرح أسبابه خطوة بخطوة. يؤدي هذا غالبًا إلى تحسين الأداء في المهام الرياضية والمهام المنطقية الثقيلة، ولكنه يزيد من طول المخرجات واستخدام الرمز المميز. كما أنه يغير بنية الاستجابة.

التكرار الفوري يفعل شيئًا مختلفًا. لا يغير نمط الإخراج. ولا يطلب من النموذج أن يفكر بصوت عالٍ. وبدلاً من ذلك، فهو يعزز كيفية تشفير الإدخال قبل بدء عملية الإنشاء.

في التجارب، عندما تم استخدام المحفزات المنطقية، أدى التكرار إلى نتائج محايدة في الغالب. هذا منطقي. إذا كان النموذج يقوم بالفعل بإعادة النظر في السؤال أثناء عملية التفكير، فإن تكرار الموجه يضيف القليل من المعلومات الجديدة.

بالنسبة للمهام التي تتطلب تفكيرًا تفصيليًا، قد تظل سلسلة الأفكار مفيدة. بالنسبة للمهام المنظمة أو ذات النمط التصنيفي حيث تحتاج إلى إجابات موجزة، فإن التكرار السريع يوفر تحسينًا أبسط وأقل تكلفة.

الوجبات الجاهزة العملية للمهندسين

إذا كنت تقوم ببناء أنظمة تعمل بنظام LLM، فإليك ما يقترحه هذا البحث:

  • اختبار التكرار السريع على المهام غير المنطقية.
  • إعطاء الأولوية لسير العمل المنظم أو الحساس للموضع.
  • قياس الدقة قبل وبعد التغيير.
  • مراقبة طول السياق لتجنب الوصول إلى حدود الرمز المميز.

نظرًا لأن هذه الطريقة لا تغير تنسيق الإخراج أو تزيد زمن الاستجابة بشكل ملحوظ، فمن الآمن اختبارها في البيئات المرحلية. وفي كثير من الحالات، يمكن تحسين المتانة دون إجراء تغييرات معمارية أو ضبط دقيق.

في أنظمة الإنتاج حيث تترجم التحسينات الصغيرة في الدقة إلى تأثير تجاري قابل للقياس، حتى بضع نقاط مئوية يمكن أن تكون ذات أهمية. وفي بعض المهام المنظمة، تكون المكاسب أكبر بكثير.

إقرأ أيضاً:

خاتمة

غالبًا ما تبدو الهندسة السريعة وكأنها تجربة وخطأ. نحن نضبط الصياغة، ونضيف القيود، ونجرب تعليمات مختلفة. إن فكرة أن مجرد تكرار الموجه بأكمله يمكن أن يحسن الدقة قد تبدو تافهة، ولكن الأدلة التجريبية تشير إلى خلاف ذلك.

عبر نماذج متعددة وسبع مهام مختلفة، أدى التكرار السريع إلى تحسين الأداء باستمرار دون زيادة طول المخرجات أو التأثير بشكل كبير على زمن الوصول. هذا النهج سهل التنفيذ، ولا يتطلب إعادة التدريب، ولا يغير تنسيق الاستجابة.

جربه بنفسك وأخبرني برأيك في قسم التعليقات.

يمكنك العثور على جميع التفاصيل هنا: التكرار الفوري يحسن ورقة بحث ماجستير إدارة الأعمال غير المنطقية

نيتيكا شارما

مرحبًا، أنا Nitika، منشئ محتوى ومسوق ماهر في مجال التكنولوجيا. الإبداع وتعلم أشياء جديدة أمر طبيعي بالنسبة لي. لدي خبرة في إنشاء استراتيجيات المحتوى المبنية على النتائج. أنا على دراية جيدة بإدارة تحسين محركات البحث، وعمليات الكلمات الرئيسية، وكتابة محتوى الويب، والاتصالات، واستراتيجية المحتوى، والتحرير، والكتابة.

قم بتسجيل الدخول لمواصلة القراءة والاستمتاع بالمحتوى الذي ينظمه الخبراء.


Source link

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى