تعرف على مساعد لانج سميث – بولي (وكيل للوكلاء)

لنكن صادقين! يعد بناء عملاء الذكاء الاصطناعي أمرًا مثيرًا، لكن تصحيح أخطائهم ليس كثيرًا. نظرًا لأننا ندفع حدود الذكاء الاصطناعي الوكيل، فإن تعقيد نظامنا يرتفع بشكل كبير. لقد كنا جميعًا هناك نحدق في أثر بمئات الخطوات، محاولين معرفة سبب هلوسة العميل أو اختياره للأداة الخاطئة. تم دمج Polly في LangSmith، وهو مساعد مدعوم بالذكاء الاصطناعي مصمم لمساعدة المطورين على تصحيح أخطاء الوكلاء وتحليلهم وهندستهم بشكل أفضل. ومن المفارقات أنها طبقة فوقية من الذكاء وكيل للوكلاء. تتناول هذه المقالة إعداد Polly وإمكانياته وكيف يساعد في إنشاء وكلاء أفضل.
لماذا نحتاج إلى وكيل للوكلاء؟
لقد أدى الانتقال من سلاسل LLM البسيطة إلى الوكلاء المستقلين إلى تقديم فئة جديدة من تحديات تصحيح الأخطاء التي لم يعد الفحص اليدوي قادرًا على حلها بكفاءة. حدد لانغشين أن هندسة الوكلاء أصعب بشكل أساسي بسبب ثلاثة عوامل:
- يطالب النظام الضخم: غالبًا ما تمتد التعليمات إلى مئات أو آلاف الأسطر، مما يجعل من المستحيل تقريبًا تحديد الجملة المحددة التي تسببت في تدهور السلوك.
- آثار التنفيذ العميقة: عندما يقوم وكيل واحد بتشغيله، فإنه يولد آلاف نقاط البيانات عبر خطوات متعددة، مما يؤدي إلى إنشاء حجم كبير من السجلات يمثل عبئًا كبيرًا على المراجعة البشرية.
- حالة السياق الطويل: يمكن أن تمتد المحادثات متعددة المنعطفات لساعات أو أيام، مما يتطلب مصحح أخطاء لفهم سجل التفاعل بالكامل لتشخيص سبب اتخاذ القرار.
تعمل Polly على حل هذه المشكلة من خلال العمل كشريك يفهم بنيات الوكيل، مما يسمح لك بتجاوز فحص السجل اليدوي وطرح أسئلة باللغة الطبيعية حول أداء نظامك بدلاً من ذلك.
كيفية إعداد بولي؟
نظرًا لأن Polly عبارة عن ميزة مضمنة في LangSmith، فلا تقم بتثبيت Polly مباشرةً. بدلاً من ذلك، يمكنك تمكين LangSmith tarcing في التطبيق الخاص بك. بمجرد تدفق بيانات وكيلك إلى المنصة، يتم تنشيط Polly تلقائيًا.
الخطوة 1: تثبيت برنامج LangSmith
أولاً، تأكد من وجود LangSmith SDK في بيئتك. قم بتشغيل الأمر التالي في سطر الأوامر لنظام التشغيل الخاص بك:
pip install –U langsmith
الخطوة 2: تكوين متغيرات البيئة
احصل على مفتاح API الخاص بك من صفحة إعداد LangSmith وقم بتعيين متغيرات البيئة التالية. يخبر هذا التطبيق الخاص بك ببدء تسجيل التتبعات إلى سحابة LangSmith.
import os
# Enable tracing (required for Polly to see your data)
os.environ("LANGSMITH_TRACING") = "true"
# Set your API Key
os.environ("LANGSMITH_API_KEY") = "ls__..."
# Optional: Organize your traces into a specific project
os.environ("LANGSMITH_PROJECT") = "my-agent-production"
الخطوة 3: قم بتشغيل الوكيل الخاص بك
هذا كل شيء، إذا كنت تستخدم LangChain، فسيكون التتبع تلقائيًا. إذا كنت تستخدم OpenAI SDK، فقم بتغليف عميلك مباشرةً لتمكين الرؤية.
from openai import OpenAI
from langsmith import wrappers
# Wrap the OpenAI client to capture inputs/outputs automatically
client = wrappers.wrap_openai(OpenAI())
# Run your agent as normal
response = client.chat.completions.create(
model="gpt-4o",
messages=({"role": "user", "content": "Analyze the latest Q3 financial report."})
)
بمجرد تشغيل الخطوات المذكورة أعلاه، انتقل إلى عرض التتبع أو عرض المواضيع في واجهة مستخدم LangSmith. سترى أيقونة Polly في الزاوية اليمنى السفلية.
قدرات بولي الأساسية
بولي ليست مجرد غلاف لروبوتات الدردشة. لقد تم دمجه بعمق في البنية التحتية لـ LangSmith لأداء ثلاث مهام حاسمة:
المهمة 1: تصحيح أخطاء التتبع العميق
في طريقة عرض التتبع، تقوم بولي بتحليل عمليات تنفيذ العميل الفردية لتحديد أوضاع الفشل الدقيقة التي قد تكون مدفونة في منتصف المدى الطويل. يمكنك طرح أسئلة تشخيصية محددة مثل:
- “هل ارتكب الوكيل أي أخطاء؟”
- ”أين تسوء الأمور بالضبط“
- “لماذا اختار الوكيل هذا النهج بدلاً من هذا”
لا تقوم بولي بإظهار المعلومات فقط. فهو يفهم أنماط سلوك الوكيل ويمكنه تحديد المشكلات التي قد تفوتك.
المهمة 2: تحليل السياق على مستوى الموضوع
تعتبر حالة تصحيح الأخطاء صعبة للغاية، خاصة عندما يعمل الوكيل بشكل جيد لمدة عشر دورات ويفشل في الدورة الحادية عشرة. يمكن لـ Polly الوصول إلى المعلومات من سلاسل المحادثات بأكملها، مما يسمح لها باكتشاف الأنماط بمرور الوقت، وتلخيص التفاعلات، وتحديد متى ولماذا فقد الوكيل مسار السياق المهم.
يمكنك طرح أسئلة مثل:
- “تلخيص ما حدث عبر تفاعلات متعددة”
- “تحديد أنماط سلوك الوكيل مع مرور الوقت”
- “اكتشف عندما فقد الوكيل سياقًا مهمًا”

يعد هذا أمرًا فعالاً بشكل خاص لتصحيح تلك المشكلات المحبطة حيث كان الوكيل يعمل بشكل جيد ثم فجأة لم يعد كذلك. تستطيع بولي أن تحدد بالضبط أين ولماذا تغيرت الأمور.
المهمة 3: الهندسة السريعة الآلية
ولعل أقوى ميزة للمطورين هي قدرة بولي على العمل كمهندس سريع خبير. موجه النظام هو عقل أي عميل عميق، ويمكن لبولي المساعدة في تكراره. يمكنك وصف السلوك المطلوب باللغة الطبيعية، وسيقوم Polly بتحديث الموجه، وتحديد مخططات الإخراج المنظمة، وتكوين تعريفات الأداة، وتحسين طول الموجه دون فقدان التعليمات الهامة.

كيف يعمل تحت غطاء محرك السيارة؟
تم بناء ذكاء Polly على أساس البنية التحتية القوية للتتبع من LangSmith والتي تلتقط كل ما يفعله وكيلك. يستوعب ثلاث طبقات من البيانات.
- أشواط: خطوات فردية مثل مكالمات LLM وتنفيذ الأدوات
- آثار: عملية إعدام واحدة لعميلك، مكونة من شجرة من عمليات التشغيل.
- المواضيع: محادثة كاملة، تحتوي على آثار متعددة.
نظرًا لأن LangSmith يلتقط بالفعل المدخلات والمخرجات وزمن الوصول وعدد الرموز المميزة لكل خطوة، فإن Polly لديها معلومات مثالية حول عالم الوكيل. ليس من الضروري تخمين ما حدث.
خاتمة
تمثل بولي تحولًا كبيرًا في كيفية تعاملنا مع دورة حياة تطوير الذكاء الاصطناعي. إنه يعترف بأنه عندما يصبح وكلاؤنا أكثر استقلالية وتعقيدًا، فإن الأدوات التي نستخدمها للحفاظ عليهم يجب أن تتطور بالتوازي. من خلال تحويل تصحيح الأخطاء من البحث اليدوي والطب الشرعي عبر السجلات إلى حوار باللغة الطبيعية، يسمح Polly للمطورين بالتركيز بشكل أقل على البحث عن الأخطاء والمزيد على التحسينات المعمارية. وفي نهاية المطاف، فإن وجود شريك ذكي يفهم حالة النظام الخاص بك ليس مجرد وسيلة راحة، بل أصبح ضرورة لهندسة الجيل القادم من الوكلاء الموثوقين من فئة الإنتاج.
الأسئلة المتداولة
ج: يساعدك على تصحيح أخطاء العوامل المعقدة وتحليلها دون البحث في المطالبات الهائلة أو الآثار الطويلة. يمكنك طرح أسئلة مباشرة حول الأخطاء أو نقاط القرار أو السلوك الغريب، وستقوم Polly بسحب الإجابات من بيانات LangSmith الخاصة بك.
ج: ما عليك سوى تشغيل تتبع LangSmith باستخدام SDK ومفتاح API الخاص بك. بمجرد تشغيل وكيلك وظهور السجلات في LangSmith، تصبح Polly متاحة تلقائيًا في واجهة المستخدم.
ج: يتمتع بإمكانية الوصول الكامل إلى عمليات التشغيل والتتبعات والسلاسل، لذا فهو يفهم كيفية عمل وكيلك داخليًا. ويتيح له هذا السياق تشخيص حالات الفشل، وتتبع السلوك على المدى الطويل، وحتى المساعدة في تحسين مطالبات النظام.
قم بتسجيل الدخول لمواصلة القراءة والاستمتاع بالمحتوى الذي ينظمه الخبراء.
Source link



