الذكاء الاصطناعي

نموذج الذكاء الاصطناعي الذي يبدو فوريًا

لا بد أنك واجهت الانتظار الذي لا ينتهي لنموذج الذكاء الاصطناعي الذي يأخذ وقته للإجابة على استفسارك. ولوضع حد لهذا الانتظار، أصبح النموذج الاستدلالي الجديد لـ Mercury 2 الخاص بـ Inception Labs مباشرًا الآن. إنه يعمل بشكل مختلف قليلاً عن الآخرين. يستخدم الانتشار لتقديم إجابات عالية الجودة بسرعة فورية تقريبًا. في هذه المقالة، سنختبر الصفات الفريدة لنموذج التفكير ميركوري 2 ونختبر نقاط قوته.

طريقة جديدة للتفكير: الانتشار مقابل الانحدار التلقائي

يعد فك التشفير الانحداري التلقائي عملية تستخدمها حاليًا معظم نماذج اللغات الكبيرة، مثل تلك التي تنتجها Google وOpenAI. إنهم ينتجون كلمة واحدة أو رمزًا نصيًا واحدًا في كل مرة. يعمل هذا كآلة كاتبة، حيث ترتبط الكلمة التالية بالكلمة السابقة.

على الرغم من أنه يعمل، إلا أنه يحتوي أيضًا على عنق الزجاجة. تتطلب الأسئلة الصعبة سلاسل من الأفكار ويجب على النموذج أن يمر عبرها بالتسلسل. هذه عملية تسلسلية تقيد السرعة ولها تكاليف عالية. إنه مفيد بشكل خاص لعمليات التفكير العميق.

يعمل نموذج التفكير ميركوري 2 بشكل مختلف. وهي من بين نماذج لغة الانتشار التجارية الأولية. بدلاً من اتباع نهج رمزي تلو الآخر، يبدأ الأمر بنسخة أولية من الإجابة الكاملة. ومن ثم يجعلها أفضل من خلال عملية الصقل. اعتبرها محررًا أكثر من كونها آلة كاتبة. فهو يتحقق من الاستجابة بأكملها ويصححها في وقت واحد، وبالتالي فهو قادر على تصحيح الأخطاء في وقت مبكر من العملية. سرعة هذه الطريقة تكمن في هذا التوازي.

وهذا ليس مفهومًا جديدًا في الذكاء الاصطناعي. لقد نجحت نماذج الانتشار بالفعل في إنشاء الصور والفيديو. يتم الآن استخدام هذه التكنولوجيا من قبل شركة إنسيبشن لابز، وهي شركة ناشئة أنشأها أكاديميون في جامعات ستانفورد، وجامعة كاليفورنيا، وكورنيل، وهي تحقق أداءً جيدًا بشكل ملحوظ.

السرعة والتكلفة: ميزة ميركوري 2

تعد سرعة نموذج الاستدلال ميركوري 2 من أبرز صفاته. لديها إنتاجية تبلغ حوالي 1000 رمزًا في المعايير. ومن المنظور المنظوري، تعمل النماذج الشائعة الأخرى مثل Claude 4.5 Haiku وGPT-5 mini بمعدل 89 و71 رمزًا في الثانية تقريبًا، على التوالي. يؤدي هذا إلى زيادة سرعة ميركوري 2 بأكثر من عشرة أضعاف. وهذا ليس مجرد رقم على الرسم البياني، ولكنه يمثل اختلافا في العالم الحقيقي. للتعامل مع المهام الأكثر تعقيدًا، قد يستغرق الأمر عدة ثوانٍ للإجابة على أحد الأسئلة من النماذج الأخرى. وفي الوقت نفسه، يمكن لـ Mercury 2 الإجابة على سؤال في أقل من ثانيتين.

هذه السرعة لا تأتي بأي ثمن. وفي واقع الأمر، فإن ميركوري 2 أقل تكلفة بكثير من منافسيها. يبلغ سعره 0.25 لكل مليون رمز إدخال وسعر إدخال يبلغ 0.75 لكل مليون رمز إخراج. ويكلف إنتاج استجابة حوالي 2.5 ضعف تكلفة إنتاج GPT-5 mini، وأكثر من 6.5 أضعاف تكلفة إنتاج كلود هايكو 4.5. هذه السرعة، إلى جانب التكلفة المنخفضة، تجعل حالات الاستخدام الجديدة ممكنة، لا سيما تلك التطبيقات التي تعتمد على التفاعلات في الوقت الفعلي والحلقات المعقدة لوكلاء الذكاء الاصطناعي.

الجودة والأداء

لا يمكن الاستفادة من السرعة إلا عندما تكون الإجابات صحيحة. وفي هذا الصدد، فإن نموذج التفكير ميركوري 2 قائم بذاته. إنه يطابق جميع النماذج الأخرى الأكثر شعبية من حيث معايير الجودة. لقد سجلت 91.1 في معيار الرياضيات AIME 2025. كما أنها سجلت نتائج جيدة في تقييم GPQA للعلوم على مستوى الدراسات العليا والتعليمات التالية على IFBench. تشير هذه الدرجات إلى أن طبيعة تصحيح الخطأ في عملية النشر لا تؤثر على الجودة على حساب السرعة.

يشجع النموذج أيضًا على استخدام نافذة سياق بحجم 128 كيلو بايت، واستخدام الأداة، ومخرجات JSON. ومن ثم فهي أداة مفيدة للمطورين. تعتبر الميزات حاسمة في إنشاء التطبيقات المتقدمة التي تتطلب تفكيرًا عالي الإنتاجية. إن قدرته على معالجة المعلومات الضخمة والتواصل مع التطبيقات الأخرى تجعله في موقع مناسب في تطبيقات مثل المساعدين الصوتيين في الوقت الحقيقي، وأدوات البحث، والمساعدة البرمجية

التدريب العملي على نموذج الاستدلال ميركوري 2

نظرا لصدقه. يتم فهم الزئبق 2 بشكل أكثر فعالية من خلال التجربة. يمكنك إما التفاعل مع النموذج أو الاشتراك في الوصول إلى واجهة برمجة التطبيقات (API) لإنشاء تطبيقاتك الخاصة.

إحدى الطرق الممتازة لتجربة النموذج واختبار الإمكانات الفريدة هي تجربة إعداد جهد الاستدلال الخاص به. مشكلة بسيطة وواقعية.

اختبار غسيل السيارات

اطرح على النموذج السؤال التالي:

“أريد أن أغسل سيارتي. مغسلة السيارات تبعد 50 متراً. هل يجب أن أمشي أم أقود السيارة؟”

يقدم النموذج ذو الجهد الاستدلالي المنخفض إجابة معقولة وبسيطة: فهو أرخص ويمكن تنفيذه في بضع دقائق سيرًا على الأقدام. إنها تعترف بحق بالمشي باعتباره الخيار الأكثر فعالية للمسافات القصيرة.

ومع ذلك، كلما بذلت المزيد من الجهد المنطقي، أصبح النموذج أكثر واقعية وعملية. يأخذ في الاعتبار طبيعة غسيل السيارة. في حالة غسل السيارة، الشيء العقلاني الوحيد الذي يجب فعله هو القيادة. وفي حال كانت محطة خدمة ذاتية، فقد يكون المشي هو الحل بشرط أن تكون الظروف جيدة. ويولد سياق الاستدلال المتفوق توصية أكثر فائدة ومتوافقة مع السياق: في حالة غالبية مغاسل السيارات، تكون القيادة هي الخيار الأسهل.

إنه مجرد اختبار بسيط يوضح كيف يمكن أن تؤدي العملية التكرارية لتحسين النموذج إلى مزيد من الفهم، مع توفير المزيد من الوقت للتفكير.

اختبار تلخيص المقال

إليكم مقالتي السابقة حول مقاييس تقييم LLM، وهي مقالة كبيرة جدًا للقراءة. دعونا نحاول تلخيصها حسب الأقسام، ودعونا نرى كم من الوقت سيستغرق.

اِسْتَدْعَى:

https://www.analyticsvidhya.com/blog/2025/03/llm-evaluation-metrics/

هنا مقالة من 5000 إلى 10000 كلمة. قم بتلخيص القطعة بأكملها بنبرة أكثر إقناعًا، وتحسين الوضوح، وإزالة التكرار، وتعزيز المقدمة والخاتمة، والتأكد من اتساق المصطلحات طوال الوقت.

عندما قمنا بتشغيل هذه المطالبة في Mercury 2، استخرجت المقالة على الفور وأعطت النتائج في أقل من 3 ثوانٍ.

فيديو:

من باب الفضول، عندما جربت نفس المطالبة على ChatGPT، استغرق الأمر 25 ثانية تقريبًا. استغرق الأمر هذا الوقت فقط للتفكير فيما يجب فعله وكيفية القيام به و10 ثوانٍ أخرى لتوليد الإجابة.

الخلاصة: لمحة عن مستقبل الذكاء الاصطناعي

إن نموذج التفكير Mercury 2 ليس مجرد لاعب آخر في سوق الذكاء الاصطناعي المكتظ. إنه التغيير المحتمل في مقاربة الذكاء الاصطناعي في بنائه واتصالاته. إنه يعالج القضية الأساسية المتمثلة في زمن الوصول، وبالتالي يفتح الباب أمام جيل جديد من التطبيقات سريعة الاستجابة. قريبًا، ستنتهي الأيام التي يحتاج فيها الذكاء الاصطناعي إلى التفكير. يمكن القول أن مستقبل الذكاء الاصطناعي سيكون سريعًا ورخيصًا وقويًا بشكل مدهش مع نماذج مثل Mercury 2.

الأسئلة المتداولة

ما هو نموذج المنطق ميركوري 2؟

نموذج الاستدلال Mercury 2 هو نموذج لغة كبير جديد من Inception Labs يستخدم أسلوبًا قائمًا على الانتشار لإنشاء نص بسرعات عالية.

كيف يختلف Mercury 2 عن LLMs الأخرى؟

بدلاً من إنشاء نص كلمة بكلمة، يقوم Mercury 2 بإنشاء مسودة للاستجابة الكاملة وتحسينها بالتوازي، مما يجعلها أسرع بكثير.

ما مدى سرعة عطارد 2؟

يمكن لـ Mercury 2 إنشاء نص بمعدل 1000 رمز في الثانية تقريبًا، وهو أسرع بحوالي عشر مرات من النماذج المماثلة.

هل ميركوري 2 جيد مثل الموديلات الأخرى؟

نعم، وفقًا لمعايير الجودة، يعمل Mercury 2 بشكل تنافسي مع النماذج العليا الأخرى في مجالات مثل الرياضيات والعلوم ومتابعة التعليمات.

كيف يمكنني تجربة ميركوري 2؟

يمكنك الدردشة مع النموذج مباشرةً أو الاشتراك للوصول المبكر إلى واجهة برمجة التطبيقات (API) من خلال موقع Inception Labs الإلكتروني.

هارش ميشرا

هارش ميشرا هو مهندس الذكاء الاصطناعي والتعلم الآلي الذي يقضي وقتًا أطول في التحدث إلى نماذج اللغات الكبيرة مقارنة بالبشر الفعليين. شغوف بـ GenAI وNLP وجعل الآلات أكثر ذكاءً (لذلك لا يحل محله بعد). عندما لا يقوم بتحسين النماذج، فمن المحتمل أنه يقوم بتحسين تناول القهوة. 🚀☕

قم بتسجيل الدخول لمواصلة القراءة والاستمتاع بالمحتوى الذي ينظمه الخبراء.


Source link

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى