الذكاء الاصطناعي

تجربة نموذج الصور المضغوط والسريع المزود بتقنية الذكاء الاصطناعي

أرى أن نماذج صور الذكاء الاصطناعي تتحسن كل شهر. مخرجات أكثر وضوحًا ومعلمات أكثر ونتائج معيارية أعلى. فلماذا أنا، أو أي شخص في هذا الشأن، متحمسون لنموذج صورة أصغر للذكاء الاصطناعي؟ حسنًا، لأن معظم نماذج الصور لا تزال تتصرف مثل الأدوات غير المتصلة بالإنترنت. أنت تطالب، وتنتظر، وتأمل. لا يوجد شيء تفاعلي حول ذلك. وبالتأكيد لا شيء في الوقت الحقيقي. Flux.2 Klein موجود الآن هنا لتغيير هذا النمط من إنشاء الصور وتحريرها بواسطة الذكاء الاصطناعي بهدوء.

تم تصميم Flux.2 Klein خصيصًا للسرعة وزمن الوصول المنخفض والأجهزة اليومية، وهو أحدث نموذج لصور الذكاء الاصطناعي من Black Forest Labs. لقد تم تصميمه في المقام الأول لتوليد صور أسرع، باعتباره ذكاءً اصطناعيًا سريع الاستجابة، وليس ثقيلًا. الاسم نفسه يعطي فكرة. تأتي كلمة “كلاين” من الكلمة الألمانية التي تعني “صغير”، وهذه الفلسفة تمر عبر النموذج. صغيرة ولكنها سريعة – صغيرة ولكنها عملية – صغيرة ولكنها جاهزة للإنتاج.

وبمجرد أن ترى ما تقدمه هذه التقنية، خاصة في سير العمل التفاعلي، فإنك تدرك أن الأشخاص في Black Forest Labs لم يعودوا يطاردون النموذج الأكبر بعد الآن. مع Flux.2 Klein، يركزون بشكل أكبر على بناء ذكاء الصورة الذي يتماشى بالفعل معك ومع مهامك.

وفيما يلي نظرة على النموذج الجديد بالتفصيل.

ما هو Flux.2 كلاين؟

في جوهره، يعد Flux.2 Klein نموذجًا لتوليد الصور وتحريرها، كما تقول الشركة، “لإنشاء الصور في الوقت الفعلي دون التضحية بالجودة”، خاصة فيما يتعلق بقدرات الأجهزة المحدودة.

تعمل معظم نماذج الصور اليوم على تحسين الجودة البصرية القصوى، حتى لو كان ذلك يعني زمن وصول أعلى ومتطلبات أجهزة أكثر ثقلاً. يأخذ Flux.2 Klein الطريق المعاكس. فهو يعطي الأولوية للسرعة والاستجابة وقابلية النشر، خاصة على الأجهزة المخصصة للمستهلكين وإعدادات الحافة.

يشكل Flux.2 Klein جزءًا من عائلة Flux.2، ولكنه أصغر وأسرع عمدًا من إخوته الأكبر. الهدف هنا بسيط: جعل إنشاء الصور يبدو أقل كمهمة مجمعة وأكثر كنظام مباشر يمكنك العمل معه في الوقت الفعلي.

وهذا يجعل Flux.2 Klein مناسبًا بشكل خاص لحالات الاستخدام حيث تكون سرعة التكرار مهمة. قد يشمل ذلك المعاينات المباشرة والتحرير التفاعلي والنماذج الأولية السريعة وتطبيقات الإنتاج التي لا يمكنها تحمل أوقات الانتظار الطويلة. يتضمن هذا بوضوح سير العمل الوكيل حيث يشكل إنشاء الصور جزءًا صغيرًا من عملية أكبر ويحتاج إلى تنفيذ سريع.

باختصار، لا يحاول Flux.2 Klein الفوز بمسابقة “أفضل صورة”. إنها تحاول الفوز في مسابقة سهولة الاستخدام.

عائلة كلاين: نماذج في لمحة

Flux.2 Klein ليس نموذجًا واحدًا ولكنه عائلة صغيرة مصممة لهذا الغرض. كل متغير موجود لسير عمل محدد للغاية. فيما يلي النماذج الأربعة التي تشكل جزءًا منه.

  • (klein) 4B – هو الطراز الأسرع في المجموعة، وهو مصمم لتحقيق أقصى سرعة ونشر حافة وأداء سلس على الأجهزة الاستهلاكية. إذا كان إنشاء الصور في الوقت الفعلي هو الأولوية، فهذا هو النموذج المناسب لك.
  • (klein) 9B – هو “النموذج الصغير الرئيسي”، مما يمنحك توازنًا أفضل بين الجودة وزمن الوصول. يستهدف هذا الإصدار بشكل مباشر التطبيقات على مستوى الإنتاج حيث تريد دقة بصرية أقوى دون التضحية بالاستجابة.

ثم تأتي بعد ذلك نماذج القاعدة أو “الأساسات ذات القدرة الكاملة”، كما تحب شركة Black Forest Labs أن تسميها.

  • (klein) تم تصميم قاعدة 4B لضبط الأجهزة المحدودة، مما يمنح المطورين التحكم الكامل في السلوك والمخرجات.
  • (klein) تذهب قاعدة 9B إلى أبعد من ذلك، حيث تستهدف سير عمل البحث، وتدريب LoRA، والحد الأقصى من تنوع المخرجات.

بعبارات بسيطة، تتيح لك عائلة كلاين الاختيار بين السرعة أو الجودة أو التحكم، دون فرض قرار واحد يناسب الجميع.

النماذج المقطرة مقابل النماذج الأساسية

أفضل ما في عائلة Flux.2 Klein هو خيارات التصميم المرنة التي تقدمها بين النماذج المقطرة والنماذج الأساسية. تم تصميم نماذج كلاين المقطرة لتعمل في أربع خطوات نشر فقط. هذا ليس خطأ مطبعي. أربع خطوات. هذا كل شيء! وهذا هو سبب شعورهم بالسرعة والاستجابة، حتى على الأجهزة المتواضعة. أنت تستبدل القليل من التنوع الخام بالسرعة، ولكنك تكتسب شيئًا أكثر قيمة بكثير للاستخدام في العالم الحقيقي: ردود الفعل الفورية.

من ناحية أخرى، تتبع الطرازات الأساسية المسار التقليدي بما يصل إلى 50 خطوة انتشار. فهي أبطأ، ولكنها أكثر مرونة بكثير. تهدف هذه النماذج إلى الضبط الدقيق والبحث وتدريب LoRA والسيناريوهات التي تريد فيها تحكمًا أعمق في الأسلوب والبنية والتنوع.

لذا فإن الاختيار لا يتعلق بـ “الأفضل” أو “الأسوأ”. يتعلق الأمر بالنية.

إذا كنت تريد الإنشاء في الوقت الفعلي والتحرير التفاعلي، فإن النماذج المقطرة هي الاختيار الواضح. إذا كنت تريد التدريب أو التخصيص أو التجربة بعمق، فاختر النماذج الأساسية.

الأداء المعياري

لم تشارك Flux.2 Klein أدائها القياسي بالمعنى التقليدي. ونظرًا لأنه يعمل على تحسين جودة الصورة القابلة للاستخدام في الثانية ولكل جيجابايت من VRAM، فإنه يتجنب مطاردة لوحات الصدارة التي تتجاهل حدود زمن الوصول والأجهزة.

هذا هو بالضبط ما تم تصميم المخططات القياسية التي شاركتها Black Forest Labs لإظهارها.

عبر مهام تحويل النص إلى صورة وصورة إلى صورة، تحدد الرسوم البيانية تصنيف Elo مقابل زمن الوصول من طرف إلى طرف واستخدام VRAM الأقصى. يعمل Elo كبديل لجودة الصورة التي يدركها الإنسان، في حين يعكس زمن الوصول وVRAM قيود النشر الحقيقية. القاعدة بسيطة: Elo الأعلى، وزمن الوصول الأقل، وVRAM الأقل هو الأفضل.

Flux.2 أداء كلاين المعياري

ما يبرز على الفور هو موقع Flux.2 Klein على هذه المنحنيات. يقدم الطرازان المقطران 4B و9B نتائج Elo قوية باستمرار أثناء العمل بجزء صغير من زمن الوصول وبصمة الذاكرة لخطوط الأساس الأكبر. في المقابل، غالبًا ما تحقق النماذج المنافسة من Qwen إيلو مشابهًا أو أعلى قليلاً فقط من خلال استهلاك المزيد من الوقت وذاكرة وحدة معالجة الرسومات.

لا تدعي هذه المعايير أن Flux.2 Klein ينتج الصور الأكثر تفصيلاً الممكنة. إنها تُظهر شيئًا أكثر صلة بالإنتاج: الذكاء البصري الفعال. النوع الذي يستجيب بسرعة، ويعمل على الأجهزة اليومية، ويتناسب بشكل طبيعي مع سير العمل التفاعلي.

الآن بعد أن عرفنا ما يتفوق فيه Flux.2 Klein، فقد حان الوقت لتجربة قدراته بشكل مباشر. هنا كيفية الوصول إليه.

كيفية الوصول إلى Flux.2 كلاين

لقد كانت شركة Black Forest Labs سخية بما يكفي لتقديم عرض تجريبي مجاني لـ Flux.2 Klein الجديد. ضمن مدونة الإعلان التي تقدم Flux.2 Klein الجديد، يمكنك ببساطة النقر على الرابط الذي يقرأ “جربه الآن مجانًا هنا”، وسيعيد توجيهك إلى العرض التوضيحي لنموذج الذكاء الاصطناعي الجديد.

أو يمكنك ببساطة النقر على هذا الرابط وتجربة العرض التوضيحي لـ Flux.2 Klein بنفسك.

والآن بعد أن عرفنا كيفية الوصول إليه، دعونا نخضعه لبعض الاختبارات الحقيقية فيما يتعلق بقدراته على إنشاء الصور وتحريرها.

التدريب العملي على Flux.2 كلاين

هذه هي المطالبة التي استخدمتها لاختبار Flux.2 Klein على قدراته في توليد الصور.

اِسْتَدْعَى:

صورة سينمائية لليوناردو دافنشي الذي يسافر عبر الزمن كمهندس كمي، يرتدي معطفًا مستوحى من عصر النهضة ممزوجًا بمواد مستقبلية، ويدرس مخططًا ميكانيكيًا متوهجًا يطفو في الهواء. إضاءة تشياروسكورو درامية، وتفاصيل وجه واقعية للغاية، وضباب حجمي ناعم، وتلتقي الواقعية التصويرية بالخيال العلمي، وعمق مجال ضحل، ولا توجد إشارات إلى الأعمال الفنية الموجودة.

هذه هي المطالبة التي استخدمتها لاختبار قدرات تحرير الصور الخاصة به.

الإخراج:

Flux.2 كلاين إخراج توليد الصور

اِسْتَدْعَى:

اعرض مجموعة من البشر المصغرين – 1/10 من حجم هذه الكرة – يحاولون تحريك الكرة من الجانب الأيمن. فبينما يكون بعض البشر على الأرض، يكون البعض الآخر على سلالم، ويصل ارتفاعها إلى نصف ارتفاع الكرة، ويحاولون الدفع. أظهر ما لا يقل عن 8 أشخاص يرتدون ملابس عصر النهضة

الإخراج:

Flux.2 Klein AI مخرجات تحرير الصور

خاتمة

كما رأينا واختبرنا حتى الآن، فإن نموذج الصور Flux.2 Klein AI يقدم نظرة منعشة إلى ممارسات إنشاء الصور وتحريرها بالذكاء الاصطناعي. جوهر هذا التغيير هو السرعة، مما يثبت قوته في سير العمل الوكيل. في الوقت الذي يتم فيه اعتماد مثل هذه المهام الوكيلة بشكل متزايد عبر سير العمل، قد يثبت Flux.2 Klein أنه أكثر فائدة بكثير من أي نموذج ذكاء اصطناعي كبير يعد بصور عالية الجودة، ولكن بسرعة أقل بكثير. أفضل ما في الأمر هو أن Flux.2 Klein يمكنه القيام بواجباته على أجهزتك الحالية، مما يجعل إنشاء صور الذكاء الاصطناعي وتحريرها في متناول الجماهير بشكل أكبر.

استراتيجي المحتوى الفني ومتواصل يتمتع بخبرة تزيد عن عشر سنوات في إنشاء المحتوى وتوزيعه عبر وسائل الإعلام الوطنية وحكومة الهند والمنصات الخاصة

قم بتسجيل الدخول لمواصلة القراءة والاستمتاع بالمحتوى الذي ينظمه الخبراء.


Source link

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى