Sarvam Edge: دليل المبتدئين للذكاء الاصطناعي الموجود على الجهاز في الهند

لنفترض أن هناك جهاز كمبيوتر ذكيًا في هاتفك الخلوي. إنه يستجيب على الفور، ويعرف لغتك، ويعمل بكامل طاقته حتى بدون الإنترنت. سيحافظ هذا الذكاء الاصطناعي على سرية معلوماتك على جهازك. أنها لا تحتاج إلى أي رسوم إضافية لكل سؤال. هذا هو المستقبل الذي تخلقه Sarvam Edge في الهند.
Sarvam Edge هو أحد أشكال الذكاء الاصطناعي الذي يأخذ شكل القوة لأجهزتنا ويغير علاقتنا بالتكنولوجيا كما نعرفها. سيوضح لك هذا الدليل ما هو Sarvam Edge وما هو قادر عليه. يمكنك البدء في البناء اليوم باستخدام دليل عملي بسيط.
إقرأ أيضاً: التحديث الجديد يجعل GPT-5.3 الفوري أكثر فائدة للمهام اليومية
لماذا يعد الذكاء الاصطناعي الموجود على الجهاز بمثابة تغيير في قواعد اللعبة؟
يعالج Sarvam Edge القضايا الرئيسية المتعلقة بالذكاء الاصطناعي القائم على السحابة. فهو ينقل الذكاء إلى الأداة المحمولة مباشرة من الخوادم البعيدة. وهذا يتيح تجربة أفضل للمستخدم.
هنا هو سبب أهمية هذا:
- الاستجابة الفورية (زمن الوصول المنخفض): يتم نشر الذكاء الاصطناعي على جهازك. ليس هناك تأخير. يعد هذا أمرًا ضروريًا للمساعدين الصوتيين والمترجمين المباشرين.
- الخصوصية الكاملة: تتم المعالجة بأكملها على الجانب المحلي. بياناتك لا تغادر جهازك، ولا صوتك كذلك. وهذا يضمن الخصوصية الكاملة.
- في أي مكان وفي أي وقت: Sarvam Edge لا يتطلب الإنترنت. عندما تكون الاتصالات ضعيفة، يمكن الاعتماد عليها. إنه يعمل حتى أثناء الرحلة.
- لا توجد تكلفة لكل استعلام: يستهلك الذكاء الاصطناعي أجهزة جهازك. وهذا يلغي رسوم استخدام واجهات برمجة التطبيقات السحابية. إنه ميسور التكلفة حتى يتمكن الجميع من الوصول إلى أدوات الذكاء الاصطناعي.
إقرأ أيضاً: 20 برنامج OpenClaw يطالبك بأتمتة حياتك اليومية وعملك
حافة سارفام: الغوص العميق في الأداء
نماذج Sarvam Edge قوية ولكنها صغيرة. تم تحسينها للأجهزة على الأجهزة الاستهلاكية. لديهم الإمكانات التي تنعكس في بيانات الأداء.
التعرف على الكلام على الجهاز
قام سارفام بتطوير نموذج يعرف 10 لغات هندية كبيرة. من الذكاء أن تعرف اللغة التي تتحدث بها.
- حجم الموديل: 74 مليون معلمة.
- بصمة الجهاز: ~ 294 ميجابايت.
- السرعة: تستجيب في أقل من 300 مللي ثانية على معالج Qualcomm Snapdragon 8 Gen 3. وتعالج الصوت أسرع بـ 8.5 مرات من الوقت الفعلي.
وهذه إحدى نقاط قوة النموذج. تم تقييمه على مجموعة معايير Vistaar. تشير النتائج إلى أن معدل خطأ الأحرف (CER) منخفض، وكلما انخفضت النتيجة، كان ذلك أفضل.
عادةً ما يتفوق نموذج Sarvam Edge على Google STT كما هو موضح في الرسم البياني. يُظهر دقة جيدة في لغات مثل البنغالية والهندية والبنجابية. وهذا يجعله خيارًا يمكن الاعتماد عليه لفهم الأصوات الهندية.
إقرأ أيضاً: Bulbul-V2 من Sarvam AI: أفضل نموذج TTS في الهند
تركيب الكلام على الجهاز (تحويل النص إلى كلام)
ينتج هذا الطراز صوتًا يبدو طبيعيًا. يخدم 10 لغات هندية بالإضافة إلى 8 أصوات.
- حجم الموديل: 24 مليون معلمة.
- مساحة الجهاز: 60 ميجابايت فقط.
- السرعة: في هاتف Samsung Galaxy S25 Ultra، يبدأ التحدث خلال 260 مللي ثانية. فهو يولد الصوت 5 مرات أسرع من الوقت الحقيقي.
سيبدو نفس الشخص وكأنه نموذج صوتي رائع، بغض النظر عن اللغة. استخدم Sarvam درجات تشابه المتحدثين لقياس ذلك. كلما زادت النتيجة، كلما زاد الاتساق.

درجات التشابه مرتفعة لدى كل متحدث، كما هو موضح في الرسم البياني. ويلاحظ تشابه الصوت عندما يتحدث الشخص بنفس اللغة أو عند استخدام لغات بديلة. وهذا ينتج عملية استماع سلسة وطبيعية.
الترجمة على الجهاز
يوجد نموذج واحد للترجمات يتعامل مع 11 لغة. يتكون هذا من 10 لغات هندية والإنجليزية. لديه القدرة على ترجمة أي من أزواج اللغات الـ 110 مباشرة مع بعضها البعض.
- حجم النموذج: ~150 مليون معلمة.
- بصمة الجهاز: ~ 334 ميجابايت.
- السرعة: توفر أول رمز مميز مترجم في حوالي 200 مللي ثانية. تبلغ إنتاجيته 30 رمزًا في الثانية على شريحة Snapdragon 8 Gen 3.
تم تقييم جودة الترجمة بناءً على درجة chrF على معيار FLORES. وتحدد هذه النتيجة مستوى النجاح في ترجمة النص الأصلي من حيث المعنى.

تم تصنيف نموذج Sarvam-Edge أعلى مقارنة بالنماذج الأخرى الأكثر أهمية، مثل لقاء Meta-NLLB-600M، في جميع اللغات التجريبية في الهند. وهذا يدل على أنها ذات جودة عالية ودقة في تطبيق المهام متعددة اللغات.
حافة سارفام في العمل
على الرغم من أن Sarvam Edge SDK، المتاح للاستخدام مباشرة على الأجهزة، ليس مفتوح المصدر بعد، فقد قدم الفريق بعض الأمثلة على النظام عمليًا. توضح هذه العروض التوضيحية التطبيق العملي للنماذج الموجودة في الأجهزة اليومية.
1. رؤية التعرف الضوئي على الحروف على جهاز MacBook Pro
يصور المثال الأول التعرف البصري على الأحرف المحلي (OCR) على جهاز كمبيوتر محمول. يقوم النظام بتحويل الصورة التي تحتوي على نص Odia إلى نص خالص عندما تكون غير متصلة بالإنترنت تمامًا. يعمل بسرعة تزيد عن 40 رمزًا في الثانية. ذاكرة الذروة لا تتجاوز 10 جيجابايت.
يعد هذا العرض التوضيحي نجاحًا كبيرًا في إمكانية الوصول. أوديا هو نص معقد. تم تحسينه للغاية عند التعامل معه على كمبيوتر محمول عادي محليًا. سعة الذاكرة 10 جيجابايت تعتبر معقولة. وهذا يعني أنه يمكن تنفيذ النموذج مع تطبيقات أخرى، دون تعطل النظام.
2. وساطة الأسهم الصوتية على نظام Android
يحتوي Android على مساعد مالي يدير عمليات شراء الأسهم واستفسارات المحفظة عن طريق الصوت. تتم معالجة جميع وظائف تحويل الكلام إلى نص وتحويل النص إلى كلام بواسطة الجهاز. يمكن التحقق من الأرصدة، أو يمكن شراء الأسهم حتى من دون الاتصال بالإنترنت.
العامل الأكثر أهمية في هذه الحالة هو الخصوصية. عادة ما يكون الأفراد حذرين بشأن إرسال المعلومات المالية إلى المستودعات السحابية. إن التعامل مع هذه الطلبات محليًا سيخلق الثقة. كما تعد تجربة عدم التأخير ضرورية للأسواق عالية الوتيرة حيث يكون الوقت أمرًا جوهريًا.
3. ترجمة فورية متعددة اللغات
في هذا العرض التوضيحي، يتحدث شخصان بلغات هندية مختلفة. تتم ترجمة خطابهم في الوقت الحقيقي في النظام. ويعتمد على سلسلة من النماذج المحلية للتعرف والترجمة والتركيب. الحوار ليس مصطنعاً، وتم الاحتفاظ بالمعنى الأصلي.
هذه مشكلة تواصل ضخمة يتم حلها في دولة بها العديد من اللغات. في الترجمة، يجب أن يكون زمن الوصول قريبًا من الصفر لجعله يبدو طبيعيًا. يمكن الآن إجراء محادثات سلسة عبر اللغات في أي مكان من خلال التخلص من رحلة الذهاب والإياب السحابية.
خاتمة
يعد Sarvam Edge تغييرًا كبيرًا في عالم الذكاء الاصطناعي الهندي. إنه يضع القوة في الخوادم السحابية الهائلة مباشرة في جيبك. وتظهر المعايير حقيقة أن النماذج المحلية سريعة ودقيقة. إنهم يعالجون اللغات الهندية المعقدة بزمن وصول منخفض وسرعة عالية. لا تحتاج أبدًا إلى الانتظار حتى تبدأ نهاية SDK. حاليًا، يمكننا إنشاء تطبيقات مرنة باستخدام واجهات برمجة التطبيقات المستضافة. وذلك حتى تتمكن من الانتقال إلى المعالجة المحلية بمجرد حدوثها. وهذا موقع استراتيجي عظيم. الآن لديك ما تريده الآن، وهو الخصوصية الكاملة في المستقبل. وسيضمن الذكاء الاصطناعي الموجود على الجهاز أيضًا أن تكون التكنولوجيا أكثر خصوصية وموثوقية للجميع.
الأسئلة المتداولة
فوائدها الرئيسية هي الاستجابات الفورية والخصوصية الكاملة للمستخدم. كما أنه يعمل دون اتصال بالإنترنت ولا توجد تكاليف سحابية لكل استعلام.
تدعم النماذج الموجودة على الجهاز 10 لغات هندية رئيسية والإنجليزية. وهذا يغطي مجموعة واسعة من احتياجات الكلام والترجمة.
سيتم النشر المباشر على الجهاز قريبًا. يمكنك إنشاء تطبيقات بنفس الميزات باستخدام واجهات برمجة التطبيقات المستضافة لدى Sarvam الآن.
يحصل المستخدمون الجدد على أرصدة مجانية بقيمة 1000 روبية هندية. وبعد ذلك، تتمتع الخدمات بأسعار واضحة تعتمد على الاستخدام، مثل 30 روبية هندية في الساعة لتحويل الكلام إلى نص.
تحتوي وثائق Sarvam AI الرسمية على مراجع وأدلة لواجهة برمجة التطبيقات (API). كما يوفر معلومات حول SDKs لـ Python وJavaScript.
قم بتسجيل الدخول لمواصلة القراءة والاستمتاع بالمحتوى الذي ينظمه الخبراء.
Source link



