الذكاء الاصطناعي

نانو الموز 2 هنا! أصغر وأسرع وأرخص

نانو الموز! إن نموذج الصورة الذي اجتاح العالم قد طغى للتو على نفسه. نعم! فعلت جوجل ذلك مرة أخرى. بعد وضع المعايير من خلال إطلاقهم لموز النانو، عادوا بمتابعته المرتقبة: Nano Banana 2 (المصنف رسميًا على أنه الجوزاء 3.1 صورة فلاش).

يعمل هذا النموذج الجديد على سد الفجوة بين التحكم الإبداعي بجودة الاستوديو وسرعات الإنتاج السريعة. من خلال دمج مخرجات الجودة للطبقة الاحترافية مع كفاءة بنية Flash، يهدف Nano Banana 2 إلى جعل إنشاء الصور على مستوى المؤسسات أمرًا ممكنًا.

سنتحدث عن ميزاته ونختبر أداء Nano Banana 2 في المهام الواقعية.

نانو الموز 2: ما الجديد؟

السرعة مع الجودة ستكون العبارة الصحيحة لوصف هذا النموذج الجديد. يعمل Nano Banana 2 على التخلص من المفاضلة بين العرض السريع ودقة الاستوديو، مما يوفر حلاً خاليًا من التنازلات لسير العمل المرئي.

حيث برع Nano Banana في إنشاء صور جذابة بصريًا، فإن الوقت الذي استغرقه صنع واحدة ترك الكثير مما هو مرغوب فيه. تعاملت Google مع هذه المشكلة بشكل مباشر، من خلال تبسيط البنية لتقليل زمن الوصول، مما يسمح لمنشئي المحتوى بتكرار الصور وتحسينها بسرعة من خلال المطالبات دون فترات انتظار طويلة. أثبت هذا النهج (بناءً على اختباراتي) أنه مثمر.

الميزات الرئيسية

Nano Banana 2 ليس مجرد ترقية للسرعة، بل إنه يوفر إمكانات قوية لسير العمل اليومي:

  • التأريض على شبكة الإنترنت في الوقت الحقيقي: يسحب النموذج المعلومات المباشرة والصور المرجعية من بحث Google لعرض الموضوعات والمواقع والبيانات الواقعية بدقة.
  • عرض النص المتقدم وتوطينه: يمكنه إنشاء نص واضح ودقيق للغاية داخل الصور (مثالي للملصقات أو النماذج بالحجم الطبيعي) ويسمح للمستخدمين بشكل فريد بترجمة هذا النص إلى لغات مختلفة مباشرة داخل الصورة.
  • اتساق الموضوع: يمكن للنموذج أن يحافظ على التشابه الدقيق لما يصل إلى خمس شخصيات مختلفة و14 كائنًا خلال سير عمل واحد، مما يجعله أداة قابلة للتطبيق للقصص المصورة المعقدة.
  • تنسيقات عالية الدقة: وهو يدعم الجيل الأصلي عبر العديد من نسب العرض إلى الارتفاع (بما في ذلك التنسيقات 16:9 و9:16 والتنسيقات فائقة الاتساع) ودقة تتراوح من 512 بكسل مُحسّنة لزمن الوصول إلى ترقية مذهلة بدقة 4K.

يمكنك الوصول إلى Nano Banana 2 باستخدام واجهة الويب الخاصة بـ Gemini. نانو الموز 2 هو مجاني للاستخدام لجميع المستخدمين.

دعونا نجرب نانو الموز 2

فيما يلي خمس طرق عملية لوضعها في خطواتها:

المهمة 1: موجه اختبار الرسم البياني المعلوماتي

“قم بإنشاء مخطط معلوماتي من أعلى إلى أسفل ومسطح يشرح دورة الطاقة الشمسية. تأكد من وجود تدفق بصري منطقي ومن عدم وجود أي أخطاء إملائية على الإطلاق في التسميات النصية.”

إجابة:

إنفوجرافيك جميل خالي من الأخطاء الإملائية ويجيب على السؤال بشكل مثالي، مع ضبط الصورة حسب الموضوع الذي كانت تحاول تصويره (المشاعر الخضراء الإيجابية).

المهمة 2: الترجمة داخل الصورة

“قم بإنشاء نموذج إعلاني حديث لزوج أنيق من سماعات الرأس يعرض النص الإنجليزي “Feel The Bass”.”

إجابة:

صورة بالحجم الطبيعي باستخدام نانو الموز 2

نموذج إعلاني مقنع. لكن دعونا نضفي الإثارة على الأمور قليلاً.

الموجه 2 (المتابعة): “قم بتوطين هذه الصورة المرئية من خلال ترجمة النص إلى اللغة اليابانية (‘低音を感じろ’) دون تغيير تركيبة الصورة الأساسية أو الإضاءة.”

إجابة:

اللغة اليابانية في نموذج الصورة

بدا النص الياباني في الصورة مقنعًا تمامًا. لكن بما أنني لا أستطيع قراءة اللغة اليابانية، فقد استخدمت ترجمة جوجل للتأكد من صحة الترجمة أم لا.

اختبار دقة الترجمة

رائع. هذا تقريبًا مطابق بنسبة 100% للنص الأصلي! وهذا أمر مدهش لأن Nano Banana 2 لم يكن قادرًا على ترجمة ولصق النص الياباني بطريقة مقنعة فحسب، بل اهتم أيضًا بصحة الترجمة.

ستستفيد التصميمات الرسومية متعددة اللغات كثيرًا من هذه الإمكانية التي يتمتع بها Nano Banana 2.

المهمة 3: موجه القصة المصورة للشخصية

“أنشئ تصميمًا محددًا لشخصية محقق Cyberpunk يرتدي قناعًا أزرق متوهجًا. باستخدام هذه الشخصية بالضبط، أنشئ ثلاث صور جديدة تضعها في بيئات مختلفة تمامًا: سوق ليلي صاخب، ولوبي شركة أبيض معقم، وأرض قاحلة متربة.”

إجابة:

القصة المصورة باستخدام نانو الموز 2

سايبربانك 2077 المشاعر. كان تصميم شخصية المحقق متسقًا عبر البيئات. يتم نقل البقع الموجودة على المعطف والندبة الموجودة على الجبهة والعديد من التفاصيل الأخرى باستمرار عبر المشاهد المختلفة.

هذا هو الشيء الذي عانى منه نانو بانانا.

المهمة 4: تحرير اللغة الطبيعية الدلالية

لقطة شاشة لـTLOU

“التقط هذه الصورة وقم بتغيير الجو إلى أجواء السيرك. استبدل الملابس بالبدلات الرسمية. اجعلها كما لو كانوا في معرض تصوير. لا تغير الموضوع أو مكان تواجدهم في الصورة.”

إجابة:

صورة محسنة بتقنية الذكاء الاصطناعي بواسطة نانو الموز 2

معجب. لم يتم نقل الشخصية على الإطلاق. وغيرت ملابسهم حسب التعليمات بشكل طبيعي. تمكنت Nano Banana 2 من إجراء تجديد على هذه الصورة، دون تغيير عدد من عناصرها المرئية مثل شاحنة المياه والشجرة (إلى جانب الفتاة) ودخان المدخنة.

المهمة 5: موجه التأريض المباشر للطقس

“قم بإنشاء منظر واقعي من نافذة شقة مريحة تطل مباشرة على برج إيفل، مما يعكس بدقة الظروف الجوية الحية الفعلية اليوم في باريس.”

إجابة:

صورة الموقع الحية باستخدام نانو الموز 2

تبدو هذه الصورة كصورة إنستغرام عالية الجودة. إذا أخبرت صديقك أن هذه لقطة التقطتها أثناء تواجدك في باريس، فمن المحتمل أن يصدقك. كان الوقت والظروف الجوية في باريس حتى وقت إجراء هذا الاختبار 12:52 صباحا و غائم طقس. هذا المشهد يجسد هذه التفاصيل بشكل مثالي.

مراجعة نانو الموز 2

أثناء استخدام Nano Banana 2، قمت بالملاحظات التالية:

  1. خصوصية: Nano Banana 2 هي أداة مذهلة، إذا كنت تستطيع طرحها بشكل صحيح. اسأل وسوف تحصل! المثل القديم يلخص التجربة التي مررت بها في استخدامه. كلما كانت مطالباتك أكثر وضوحًا، كانت جودة الصورة الناتجة أفضل.
  2. الدرابزين: من بين كل قوتها، فإن Nano Banana 2 سيرفض تمامًا طلب الصورة الذي يحتوي على كيان محمي بحقوق الطبع والنشر في الموجه. تجنب استخدام أسماء الشركات أو أي شيء محدد يمكن أن يؤدي إلى تشغيل حاجز الحماية هذا.
مشاكل حقوق التأليف والنشر مع نانو الموز 2
نفس المطالبة مثل المهمة 4 مع سيرك تم استبداله بـ ديزني لاند
  1. القيود: Nano Banana 2 متاح مجانًا لجميع مستخدمي طراز Gemini. لكن بعض الميزات مقفلة خلف الاشتراكات ويؤدي الاستخدام المجاني إلى تقييدها بسهولة تامة.
تقتصر ميزات Nanobanana 2 على حساب Gemini pro

الأداء والمعايير

في حين أن الأرقام القياسية الدقيقة لا تزال مستقرة، فإن الاستقبال المبكر يضع Nano Banana 2 في أعلى قوائم المتصدرين للذكاء الاصطناعي المرئي مثل Arena.ai.

  • الجوزاء 3.1 صورة فلاش
  • الجوزاء 3.1 صورة فلاش

إنه يتفوق على سابقه، Gemini 2.5 Flash Image، عن طريق تقليل زمن الوصول بشكل كبير مع مطابقة التعليمات التالية والالتزام الفوري الذي كان محجوزًا مسبقًا فقط لنموذج Gemini 3.1 Pro Image الأثقل.

خاتمة

يمثل Nano Banana 2 تحولًا كبيرًا في كيفية تعاملنا مع توليد صور الذكاء الاصطناعي. ومن خلال إزالة الاحتكاك الناتج عن أوقات العرض الطويلة مع الحفاظ على الميزات المتقدمة مثل إنشاء نص مثالي واتساق الأحرف، فإنه ينهي بشكل فعال التسوية بين السرعة والجودة.

سواء كنت أحد مسوقي المؤسسات الذين يعملون على توطين الحملات الإعلانية العالمية أو منشئ المحتوى الذي ينشئ كتابًا هزليًا، فإن Nano Banana 2 في وضع يسمح له بأن يصبح المعيار الافتراضي الجديد للجيل المرئي.

الأسئلة المتداولة

س1. ما الذي يجعل Nano Banana 2 مختلفًا عن سابقه؟

ج: فهو يجمع بين سرعة مستوى الفلاش وإنشاء صور ذات جودة احترافية، مما يزيل المفاضلة المعتادة.

س2. هل يستطيع Nano Banana 2 ترجمة النص داخل الصور التي تم إنشاؤها؟

ج: نعم، يدعم ترجمة النص داخل الصورة دون تغيير التركيب أو الإضاءة.

س3. كم عدد المواضيع التي يمكن لـ Nano Banana 2 الحفاظ عليها متسقة؟

ج: يحافظ على التناسق لما يصل إلى خمسة أحرف و14 كائنًا عبر سير العمل.

فاسو ديو سانكريتيايان

أنا متخصص في مراجعة وتحسين الأبحاث المستندة إلى الذكاء الاصطناعي والوثائق الفنية والمحتوى المتعلق بتقنيات الذكاء الاصطناعي الناشئة. تشمل خبرتي التدريب على نماذج الذكاء الاصطناعي، وتحليل البيانات، واسترجاع المعلومات، مما يسمح لي بصياغة محتوى دقيق تقنيًا ويمكن الوصول إليه.

قم بتسجيل الدخول لمواصلة القراءة والاستمتاع بالمحتوى الذي ينظمه الخبراء.


Source link

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى