بناء واجهة RAG API باستخدام FastAPI

هل تقوم ببناء أنظمة GenAI وترغب في نشرها، أم أنك تريد فقط معرفة المزيد حول FastAPI؟ ثم هذا هو بالضبط ما كنت تبحث عنه! فقط تخيل أن لديك الكثير من تقارير PDF وتريد البحث عن إجابات محددة فيها. يمكنك إما قضاء ساعات في التمرير، أو يمكنك إنشاء نظام يقرأها لك ويجيب على أسئلتك. نحن نقوم ببناء نظام RAG الذي سيتم نشره والوصول إليه من خلال واجهة برمجة التطبيقات (API) باستخدام FastAPI. لذلك، دون مزيد من اللغط، دعونا نتعمق.

ما هو FastAPI؟

FastAPI هو إطار عمل Python لبناء واجهات برمجة التطبيقات (API). يتيح لنا FastAPI استخدام أساليب HTTP للتواصل مع الخادم.

إحدى ميزاته المفيدة هي أنه يقوم تلقائيًا بإنشاء وثائق لواجهات برمجة التطبيقات التي تقوم بإنشائها. بعد كتابة التعليمات البرمجية الخاصة بك وإنشاء واجهات برمجة التطبيقات، يمكنك زيارة عنوان URL واستخدام الواجهة (Swagger UI) لاختبار نقاط النهاية الخاصة بك دون الحاجة إلى ترميز الواجهة الأمامية.

فهم واجهات برمجة تطبيقات REST

REST API هي واجهة تعمل على إنشاء اتصال بين العميل والخادم. REST API هو اختصار لـ Representational State Transfer API. يمكن للعميل إرسال طلبات HTTP إلى نقطة نهاية API محددة، ويقوم الخادم بمعالجة هذه الطلبات. هناك عدد لا بأس به من طرق HTTP الموجودة. سنقوم بتنفيذ عدد قليل منها في مشروعنا باستخدام FastAPI.

طرق HTTP:

في مشروعنا، سوف نستخدم طريقتين للتواصل:

يحصل: يستخدم هذا لاسترداد المعلومات. سنستخدم طلب GET /health للتحقق مما إذا كان الخادم قيد التشغيل.
بريد: يُستخدم هذا لإرسال البيانات إلى الخادم لإنشاء شيء ما أو معالجته. سنستخدم طلبات POST/inest و/query. نستخدم POST هنا لأنها تتضمن إرسال بيانات معقدة مثل الملفات أو كائنات JSON. المزيد عن هذا في قسم التنفيذ.

ما هو خرقة؟

يعد توليد الاسترجاع المعزز (RAG) إحدى الطرق لمنح LLM إمكانية الوصول إلى معرفة محددة لم يتم تدريبه عليها في الأصل.

مكونات راج:

استرجاع: العثور على الجمل ذات الصلة من المستند (المستندات) بناءً على الاستعلام.
جيل: تمرير هذه الجمل إلى LLM حتى يتمكن من تلخيصها في إجابة.

دعونا نفهم المزيد عن RAG في قسم التنفيذ القادم.

تطبيق

بيان المشكلة: إنشاء نظام يسمح للمستخدمين بتحميل المستندات وتحديداً ملفات .txt أو ملفات PDF. ثم يقوم بفهرستها في قاعدة بيانات قابلة للبحث ويضمن قدرة LLM على الإجابة على الأسئلة المتعلقة بالبيانات الجديدة. سيتم نشر هذا النظام واستخدامه من خلال نقاط نهاية API التي سنقوم بإنشائها من خلال FastAPI.

المتطلبات المسبقة

– سنطلب مفتاح OpenAI API، وسنستخدم نموذج gpt-4.1-mini باعتباره عقل النظام. يمكنك الحصول على مفتاح API من الرابط: (https://platform.openai.com/settings/organization/api-keys)

– بيئة تطوير متكاملة (IDE) لتنفيذ نصوص Python، سأستخدم VSCode للعرض التوضيحي. إنشاء مشروع جديد (مجلد).

– أنشئ ملف .env في مشروعك وأضف مفتاح OpenAI الخاص بك تمامًا كما يلي:

OPENAI_API_KEY=sk-proj...

– إنشاء بيئة افتراضية لهذا المشروع (لعزل تبعيات المشروع).

ملحوظة:

تأكد من إنشاء fast_env في مشروعك، حيث قد تحدث أخطاء في المسار إذا لم يتم تعيين دليل العمل على دليل المشروع.
بمجرد التنشيط، سيتم احتواء أي حزم تقوم بتثبيتها داخل هذه البيئة.

– قم بتنزيل المدونة أدناه كملف PDF باستخدام “رمز التنزيل” لاستخدامها في نظام RAG الخاص بنا: