كيفية الوصول إلى ميسترال لارج 3؟

إذا كنت تتبع شهادات LLM مفتوحة المصدر، فأنت تعلم بالفعل أن المجال يتحرك بسرعة. كل بضعة أشهر، يظهر نموذج جديد يعد باستدلال أفضل، وترميز أفضل، وتكاليف حوسبة أقل. لقد كانت ميسترال واحدة من الشركات القليلة التي تقدم هذه المطالبات باستمرار ومع ميسترال 3، فقد دفعوا الأمور إلى أبعد من ذلك. هذا الإصدار الجديد ليس مجرد تحديث آخر. يقدم ميسترال 3 مجموعة كاملة من النماذج المدمجة والفعالة مفتوحة المصدر (3B، 8B، 14B) جنبًا إلى جنب مع Mistral Large 3، وهو نموذج متناثر من MoE يحزم 41B من المعلمات النشطة داخل بنية 675B من المعلمات. في هذا الدليل، سنقوم بتفصيل ما هو جديد بالفعل في Mistral 3، وسبب أهميته، وكيفية تثبيته وتشغيله باستخدام Ollama، وكيفية أدائه في مهام التفكير والبرمجة في العالم الحقيقي.

نظرة عامة على ميسترال 3: ما هو الجديد والمهم

تم إطلاق ميسترال 3 في 2 ديسمبر 2025، ويمثل خطوة كبيرة إلى الأمام بالنسبة للذكاء الاصطناعي مفتوح المصدر. وبدلاً من ملاحقة نماذج أكبر وأكبر، ركزت ميسترال على الكفاءة وجودة الاستدلال وسهولة الاستخدام في العالم الحقيقي. تشتمل المجموعة الآن على ثلاثة نماذج كثيفة مدمجة (3B، 8B، 14B) وMistral Large 3، وهو نموذج MoE متفرق مع 41B معلمات نشطة داخل بنية 675B-parameter.

تم إصدار المجموعة بأكملها تحت Apache 2.0، مما يجعلها قابلة للاستخدام بالكامل للمشاريع التجارية، وهو أحد أكبر الأسباب التي تجعل مجتمع المطورين متحمسًا.

الميزات الرئيسية لميسترال 3

مقاسات موديلات متعددة: متوفر في متغيرات القاعدة (3ب)، والتعليمات (8ب)، والاستدلال (14ب) حتى تتمكن من اختيار ما يناسب عبء العمل الخاص بك بالضبط (الدردشة، والأدوات، والاستدلال الطويل، وما إلى ذلك).
مفتوحة ومرنة: ترخيص Apache 2.0 يجعل من Mistral 3 واحدة من أكثر العائلات النموذجية سهولة في الوصول إليها ومناسبة للأعمال اليوم.
متعدد الوسائط: تدعم جميع الطرز إدخالات النص + الصورة باستخدام برنامج تشفير الرؤية المدمج، مما يجعلها قابلة للاستخدام لفهم المستندات والرسوم البيانية والمهام المرئية.
القدرة على السياق الطويل: يمكن لـ Mistral Large 3 التعامل مع ما يصل إلى 256 ألف رمز مميز، مما يعني أنه يمكن معالجة الكتب الكاملة والعقود القانونية الطويلة وقواعد الأكواد الضخمة دفعة واحدة.
أداء أفضل من حيث التكلفة: تدعي ميسترال أن متغيرات التعليمات الجديدة الخاصة بها تتطابق مع النماذج المفتوحة المنافسة أو تتفوق عليها مع توليد عدد أقل من الرموز غير الضرورية، مما يقلل من تكلفة الاستدلال.
تحسين المنطق: يصل نموذج 14B الذي تم ضبطه إلى 85% في معيار AIME – وهو أحد أقوى الدرجات لنموذج بهذا الحجم.
حافة جاهزة: يمكن تشغيل الطرازين 3B و8B محليًا على أجهزة الكمبيوتر المحمولة ووحدات معالجة الرسومات الاستهلاكية باستخدام التكميم، ويتناسب الطراز 14B بشكل مريح مع أجهزة الكمبيوتر المكتبية عالية الأداء.

إعداد ميسترال 3 مع أولاما

إحدى فوائد ميسترال 3 هي القدرة على العمل على جهاز محلي. Ollama مجاني للاستخدام ويعمل كواجهة سطر أوامر لتشغيل نماذج اللغات الكبيرة على Linux وmacOS وWindows. يتعامل مع تنزيلات النماذج ويوفر دعم GPU تلقائيًا.

الخطوة 1: تثبيت أولاما

قم بتشغيل البرنامج النصي الرسمي لتثبيت ثنائيات وخدمات Ollama، ثم التحقق من الاستخدام ollama --version (على سبيل المثال، “إصدار ollama 0.3.0”).

curl -fsSL https://ollama.com/install.sh | sh

مستخدمو نظام التشغيل MacOS: قم بتنزيل Ollama DMG من موقع ollama.com واسحبه إلى التطبيقات. يقوم Ollama بتثبيت كافة التبعيات المطلوبة (بما في ذلك Rosetta لأجهزة Mac المستندة إلى ARM).
مستخدمي ويندوز: تحميل الأحدث .exe من مستودع Ollama GitHub. بعد التثبيت، افتح PowerShell وقم بتشغيله ollama serve. سيبدأ البرنامج الخفي تلقائيًا

الخطوة 2: إطلاق أولاما

ابدأ خدمة Ollama (عادةً ما يتم ذلك تلقائيًا):

ollama serve

يمكنك الآن الوصول إلى واجهة برمجة التطبيقات المحلية على: http://localhost:11434

الخطوة 3: اسحب نموذج ميسترال 3

لتنزيل نموذج Instruct 8B الكمي:

ollama pull Mistral :8b-instruct-q4_0

الخطوة 4: تشغيل النموذج بشكل تفاعلي

ollama run Mistral :8b-instruct-q4_0

يؤدي هذا إلى فتح REPL تفاعلي. اكتب أي مطالبة، على سبيل المثال:

> Explain quantum entanglement in simple terms.

سوف يستجيب النموذج على الفور، ويمكنك مواصلة التفاعل معه.

الخطوة 5: استخدم واجهة برمجة تطبيقات Olma

يكشف Ollama أيضًا عن REST API. فيما يلي نموذج لطلب cURL لإنشاء التعليمات البرمجية:

curl http://localhost:11434/api/generate -d '{ 
"model": "Mistral :8b-instruct-q4_0", 
"prompt": "Write a Python function to sort a list.", 
"stream": false 
}'

اقرأ أيضًا: كيفية تشغيل نماذج LLM محليًا باستخدام Olma؟

قدرات ميسترال 3

ميسترال 3 عبارة عن مجموعة نماذج للأغراض العامة تتيح استخدامها للدردشة والإجابة على الأسئلة والاستدلال وتوليد وتحليل التعليمات البرمجية ومعالجة المدخلات المرئية. يحتوي على برنامج تشفير الرؤية الذي يمكنه تقديم استجابات وصفية لصور معينة. لتوضيح قدرات نماذج ميسترال 3، استخدمناها في ثلاث مجموعات من مسائل التفكير المنطقي والترميز:

القدرة على التفكير مع لغز المنطق
توثيق الكود وفهمه
مهارات الترميز مع تنفيذ المعالجة المتعددة

ولتحقيق ذلك، استخدمنا شركة Ollama للاستعلام عن نماذج ميسترال 3 ولاحظنا مدى جودة أدائها. وستتبع ذلك مناقشة موجزة للمهام ونتائج الأداء والمعايير المرجعية.

المهمة 1: القدرة على التفكير باستخدام اللغز المنطقي

اِسْتَدْعَى:

أربعة أصدقاء: A وB وC وD يشتبه في أنهم يخفون مفتاحًا واحدًا. كل منهم يدلي ببيان واحد:
ج: “ب لديه المفتاح.”
ب: “ج ليس لديه المفتاح.”
ج: “د لديه المفتاح.”
د: “ليس لدي المفتاح.”
قيل لك بالضبط أن إحدى هذه العبارات الأربعة صحيحة. من يخفي المفتاح؟

الرد من ميسترال 8B:

القدرة على التفكير مع مخرجات اللغز المنطقي

بعد ذلك يستغرق الأمر بضع ثوانٍ وتقييم وتحليل جميع السيناريوهات المحتملة. قبل القفز إلى الاستنتاج ويعطي الإجابة الصحيحة مثل C في حوالي 50 ثانية.

القدرة على التفكير مع مخرجات اللغز المنطقي 2

رأيي:

قام النموذج بحل اللغز بشكل صحيح واتبع نهجًا تفكيريًا خطوة بخطوة. لقد استكشفت كل السيناريوهات المحتملة قبل أن تستنتج أن لغة C تحمل المفتاح. ومع ذلك، كان زمن الوصول ملحوظًا: استغرق الطراز 8B حوالي 40-50 ثانية للاستجابة. من المحتمل أن يكون هذا التأخير بسبب قيود الأجهزة المحلية وليس مشكلة نموذجية متأصلة.

المهمة 2: توثيق الكود وفهمه

اِسْتَدْعَى:

أعطني الوثائق الكاملة للكود من ملف التعليمات البرمجية. تذكر أن الوثائق يجب أن تحتوي على:
1) سلاسل الوثيقة
2) التعليقات
3) التوثيق التفصيلي للوظائف

الرد من ميسترال 3:

رأيي:

كانت مخرجات الوثائق قابلة للاستخدام ولكنها لم تتماشى بشكل كامل مع التعليمات. كانت العناصر الأساسية مثل سلاسل المستندات والتعليقات المضمنة والتفسيرات التفصيلية على مستوى الوظيفة إما غير كاملة أو مفقودة تمامًا. على الرغم من أن النموذج فهم المهمة، إلا أنه فشل في تنظيم الوثائق بتنسيق شامل وجاهز للمطورين.

المهمة 3: مهارات البرمجة مع تنفيذ المعالجة المتعددة

اِسْتَدْعَى:

تنفيذ برنامج Python الذي يستخدم وحدة المعالجة المتعددة لحساب مجموع مربعات الأعداد الطبيعية N الأولى على التوازي.
قسّم نطاق الأرقام إلى أجزاء أصغر، ودع كل عملية تحسب المجموع الجزئي للمربعات لقطعتها، وأخيرًا اجمع النتائج الجزئية للحصول على المجموع الإجمالي.
ثم قارن أداء تنفيذ المعالجة المتعددة بإصدار العملية الواحدة.

الرد من ميسترال 3:

import multiprocessing
import time
import math


def sum_of_squares_single(n):
    """Compute the sum of squares of the first N natural numbers in a single process."""
    return sum(i ** 2 for i in range(1, n + 1))


def sum_of_squares_parallel(n, num_processes=None):
    """Compute the sum of squares in parallel using multiprocessing."""
    if num_processes is None:
        num_processes = multiprocessing.cpu_count()

    chunk_size = n // num_processes
    chunks = ((i * chunk_size + 1, (i + 1) * chunk_size) for i in range(num_processes))

    def compute_chunk(start, end):
        return sum(i ** 2 for i in range(start, end + 1))

    with multiprocessing.Pool(processes=num_processes) as pool:
        partial_sums = pool.map(lambda args: compute_chunk(*args), chunks)

    return sum(partial_sums)


def compare_performance(n):
    """Compare single-process and parallel performance."""
    print(f"Computing sum of squares for the first {n} natural numbers...")

    # Single-process
    start_time = time.time()
    single_result = sum_of_squares_single(n)
    single_time = time.time() - start_time
    print(f"Single-process time: {single_time:.6f} seconds")
    print(f"Single-process result: {single_result}")

    # Parallel
    start_time = time.time()
    parallel_result = sum_of_squares_parallel(n)
    parallel_time = time.time() - start_time
    print(f"Parallel time: {parallel_time:.6f} seconds")
    print(f"Parallel result: {parallel_result}")

    print(f"\nSpeedup: {single_time / parallel_time:.2f}x")


if __name__ == "__main__":
    N = 10**6  # Example: Compute for first 1,000,000 numbers
    compare_performance(N)

الرد من المحطة

مهارات الترميز مع مخرجات تنفيذ المعالجة المتعددة ميسترال 3

رأيي:

كان توليد الكود قويًا. أنتج النموذج حلاً معياريًا ونظيفًا وعمليًا للمعالجة المتعددة. لقد نفذ بشكل صحيح منطق التقطيع، وتجمع العمليات، وحساب المجموع الجزئي، ومقارنة واضحة للأداء. ومع ذلك، كما هو الحال مع المهمة 2، كانت التعليمات البرمجية تفتقر إلى التعليقات والمستندات المناسبة. على الرغم من أن المنطق كان دقيقًا وقابلاً للتشغيل بشكل كامل، إلا أن غياب التعليقات التوضيحية أدى إلى تقليل وضوحه بشكل عام وسهولة تطويره.

اقرأ أيضًا: أفضل 12 ماجستيرًا في إدارة الأعمال مفتوحة المصدر لعام 2025 واستخداماتها

المقارنة المعيارية والملاحظات

الأداء الجماعي لميسترال 3 متفوق. فيما يلي المعايير والنتائج الرئيسية من وقت تشغيل النموذج:

زعيم مفتوح المصدر

ميسترال لارج، كنموذج مفتوح المصدر بغض النظر عن القدرة على التفكير، نشر أعلى تصنيف له على LMArena (رقم 2 في فئة النموذج المفتوح، رقم 6 بشكل عام). لديها تصنيفات مساوية أو أفضل في معيارين شائعين، MMMLU للمعرفة العامة وMMMLU للاستدلال، متفوقة على العديد من النماذج المغلقة الرائدة.

الرياضيات والاستدلال المعايير

بالإضافة إلى معايير الرياضيات، سجل ميسترال 14B أعلى من Qwen-14B في AIME25 (0.85 مقابل 0.737) وGPQA Diamond (0.712 مقابل 0.663). في حين أن AIME25 يقيس القدرة الرياضية (مجموعة بيانات MATH)، فإن المعايير الأخرى تقيس مهام التفكير. نتائج اختبار MATH: حقق Mistral 14B حوالي 90.4% مقارنة بـ 85.4% لنموذج Google 12B.

معايير الكود

بالنسبة لمعيار HumanEval، سجل نموذج Codestral المتخصص (الذي وجدناه فعالاً) 86.6% في اختباراتنا. لاحظنا أيضًا أن Mistral أنتجت حلولًا دقيقة لمعظم مشكلات الاختبار، ولكن نظرًا لتصميمها المتوازن، فإنها تحتل مرتبة متأخرة قليلًا عن أكبر نماذج الترميز في بعض لوحات المتصدرين للتحدي.

الكفاءة (السرعة والرموز)

يتمتع ميسترال 3 بوقت تشغيل فعال. أظهر تقرير حديث أن نموذج 8B الخاص به يحقق حوالي 50-60 رمزًا مميزًا في الثانية على وحدات معالجة الرسومات الحديثة. تستهلك النماذج المدمجة أيضًا ذاكرة أقل: على سبيل المثال، يستهلك الطراز 3B بضعة غيغابايت على القرص، ويستهلك الطراز 8B حوالي 5 غيغابايت، والطراز 14B حوالي 9 غيغابايت (غير مكمّم).

مواصفات الأجهزة

لقد تحققنا من أن وحدة معالجة الرسومات سعة 16 جيجابايت توفر أداءً كافيًا لـ Mistral 3B. يتطلب الطراز 8B عمومًا حوالي 32 جيجابايت من ذاكرة الوصول العشوائي و8 جيجابايت من ذاكرة وحدة معالجة الرسومات؛ ومع ذلك، يمكن تشغيله مع تكميم 4 بت على وحدة معالجة الرسومات 6-8 جيجابايت. تتطلب العديد من مثيلات طراز 14B عادةً بطاقة رسوميات من الدرجة الأولى أو من الدرجة الأولى (على سبيل المثال، ذاكرة VRAM بسعة 24 جيجابايت) و/أو وحدات معالجة رسومات متعددة. يمكن تشغيل إصدارات وحدة المعالجة المركزية فقط من النماذج الصغيرة باستخدام الاستدلال الكمي، على الرغم من أن وحدات معالجة الرسومات تظل الخيار الأسرع.

خاتمة

يبرز ميسترال 3 كنموذج مفتوح المصدر سريع، قادر، ويمكن الوصول إليه، ويعمل بشكل جيد عبر التفكير والترميز ومهام العالم الحقيقي. تعمل متغيراتها الصغيرة محليًا بسهولة، وتوفر النماذج الأكبر دقة تنافسية بتكلفة أقل. سواء كنت مطورًا أو باحثًا أو متحمسًا للذكاء الاصطناعي، جرب Mistral 3 بنفسك وشاهد مدى ملاءمته لسير عملك.

مرحبًا! أنا Vipin، متحمس لعلم البيانات والتعلم الآلي ولدي أساس قوي في تحليل البيانات وخوارزميات التعلم الآلي والبرمجة. لدي خبرة عملية في بناء النماذج وإدارة البيانات الفوضوية وحل مشكلات العالم الحقيقي. هدفي هو تطبيق الرؤى المستندة إلى البيانات لإنشاء حلول عملية تؤدي إلى تحقيق النتائج. أنا حريص على المساهمة بمهاراتي في بيئة تعاونية مع الاستمرار في التعلم والنمو في مجالات علوم البيانات والتعلم الآلي والبرمجة اللغوية العصبية.

قم بتسجيل الدخول لمواصلة القراءة والاستمتاع بالمحتوى الذي ينظمه الخبراء.

Source link

نظرة عامة على ميسترال 3: ما هو الجديد والمهم

الميزات الرئيسية لميسترال 3

إعداد ميسترال 3 مع أولاما

الخطوة 1: تثبيت أولاما

الخطوة 2: إطلاق أولاما

الخطوة 3: اسحب نموذج ميسترال 3

الخطوة 4: تشغيل النموذج بشكل تفاعلي

الخطوة 5: استخدم واجهة برمجة تطبيقات Olma

قدرات ميسترال 3

المهمة 1: القدرة على التفكير باستخدام اللغز المنطقي

المهمة 2: توثيق الكود وفهمه

المهمة 3: مهارات البرمجة مع تنفيذ المعالجة المتعددة

المقارنة المعيارية والملاحظات

زعيم مفتوح المصدر

الرياضيات والاستدلال المعايير

معايير الكود

الكفاءة (السرعة والرموز)

مواصفات الأجهزة

خاتمة

قم بتسجيل الدخول لمواصلة القراءة والاستمتاع بالمحتوى الذي ينظمه الخبراء.

"أشياء غريبة 5: المجلد. برنامج Netflix الأكثر مشاهدة في معظم البلدان

عطلات الشتاء حول العالم: الاحتفالات الموسمية في الخارج

مقالات ذات صلة

بناء واجهة RAG API باستخدام FastAPI

شرح الحتمية مقابل العشوائية (أمثلة تعلم الآلة والمخاطر)

نانو الموز 2 مقابل نانو الموز برو: ما هو الفرق؟

الكمبيوتر الحائر هنا لتغيير الطريقة التي نستخدم بها الذكاء الاصطناعي

اترك تعليقاً إلغاء الرد