نانو الموز 2 هنا! أصغر وأسرع وأرخص

نانو الموز! إن نموذج الصورة الذي اجتاح العالم قد طغى للتو على نفسه. نعم! فعلت جوجل ذلك مرة أخرى. بعد وضع المعايير من خلال إطلاقهم لموز النانو، عادوا بمتابعته المرتقبة: Nano Banana 2 (المصنف رسميًا على أنه الجوزاء 3.1 صورة فلاش).
يعمل هذا النموذج الجديد على سد الفجوة بين التحكم الإبداعي بجودة الاستوديو وسرعات الإنتاج السريعة. من خلال دمج مخرجات الجودة للطبقة الاحترافية مع كفاءة بنية Flash، يهدف Nano Banana 2 إلى جعل إنشاء الصور على مستوى المؤسسات أمرًا ممكنًا.
سنتحدث عن ميزاته ونختبر أداء Nano Banana 2 في المهام الواقعية.
نانو الموز 2: ما الجديد؟
السرعة مع الجودة ستكون العبارة الصحيحة لوصف هذا النموذج الجديد. يعمل Nano Banana 2 على التخلص من المفاضلة بين العرض السريع ودقة الاستوديو، مما يوفر حلاً خاليًا من التنازلات لسير العمل المرئي.
حيث برع Nano Banana في إنشاء صور جذابة بصريًا، فإن الوقت الذي استغرقه صنع واحدة ترك الكثير مما هو مرغوب فيه. تعاملت Google مع هذه المشكلة بشكل مباشر، من خلال تبسيط البنية لتقليل زمن الوصول، مما يسمح لمنشئي المحتوى بتكرار الصور وتحسينها بسرعة من خلال المطالبات دون فترات انتظار طويلة. أثبت هذا النهج (بناءً على اختباراتي) أنه مثمر.
الميزات الرئيسية
Nano Banana 2 ليس مجرد ترقية للسرعة، بل إنه يوفر إمكانات قوية لسير العمل اليومي:
- التأريض على شبكة الإنترنت في الوقت الحقيقي: يسحب النموذج المعلومات المباشرة والصور المرجعية من بحث Google لعرض الموضوعات والمواقع والبيانات الواقعية بدقة.
- عرض النص المتقدم وتوطينه: يمكنه إنشاء نص واضح ودقيق للغاية داخل الصور (مثالي للملصقات أو النماذج بالحجم الطبيعي) ويسمح للمستخدمين بشكل فريد بترجمة هذا النص إلى لغات مختلفة مباشرة داخل الصورة.
- اتساق الموضوع: يمكن للنموذج أن يحافظ على التشابه الدقيق لما يصل إلى خمس شخصيات مختلفة و14 كائنًا خلال سير عمل واحد، مما يجعله أداة قابلة للتطبيق للقصص المصورة المعقدة.
- تنسيقات عالية الدقة: وهو يدعم الجيل الأصلي عبر العديد من نسب العرض إلى الارتفاع (بما في ذلك التنسيقات 16:9 و9:16 والتنسيقات فائقة الاتساع) ودقة تتراوح من 512 بكسل مُحسّنة لزمن الوصول إلى ترقية مذهلة بدقة 4K.
يمكنك الوصول إلى Nano Banana 2 باستخدام واجهة الويب الخاصة بـ Gemini. نانو الموز 2 هو مجاني للاستخدام لجميع المستخدمين.
دعونا نجرب نانو الموز 2
فيما يلي خمس طرق عملية لوضعها في خطواتها:
المهمة 1: موجه اختبار الرسم البياني المعلوماتي
“قم بإنشاء مخطط معلوماتي من أعلى إلى أسفل ومسطح يشرح دورة الطاقة الشمسية. تأكد من وجود تدفق بصري منطقي ومن عدم وجود أي أخطاء إملائية على الإطلاق في التسميات النصية.”
إجابة:
إنفوجرافيك جميل خالي من الأخطاء الإملائية ويجيب على السؤال بشكل مثالي، مع ضبط الصورة حسب الموضوع الذي كانت تحاول تصويره (المشاعر الخضراء الإيجابية).
المهمة 2: الترجمة داخل الصورة
“قم بإنشاء نموذج إعلاني حديث لزوج أنيق من سماعات الرأس يعرض النص الإنجليزي “Feel The Bass”.”
إجابة:

نموذج إعلاني مقنع. لكن دعونا نضفي الإثارة على الأمور قليلاً.
الموجه 2 (المتابعة): “قم بتوطين هذه الصورة المرئية من خلال ترجمة النص إلى اللغة اليابانية (‘低音を感じろ’) دون تغيير تركيبة الصورة الأساسية أو الإضاءة.”
إجابة:

بدا النص الياباني في الصورة مقنعًا تمامًا. لكن بما أنني لا أستطيع قراءة اللغة اليابانية، فقد استخدمت ترجمة جوجل للتأكد من صحة الترجمة أم لا.

رائع. هذا تقريبًا مطابق بنسبة 100% للنص الأصلي! وهذا أمر مدهش لأن Nano Banana 2 لم يكن قادرًا على ترجمة ولصق النص الياباني بطريقة مقنعة فحسب، بل اهتم أيضًا بصحة الترجمة.
ستستفيد التصميمات الرسومية متعددة اللغات كثيرًا من هذه الإمكانية التي يتمتع بها Nano Banana 2.
المهمة 3: موجه القصة المصورة للشخصية
“أنشئ تصميمًا محددًا لشخصية محقق Cyberpunk يرتدي قناعًا أزرق متوهجًا. باستخدام هذه الشخصية بالضبط، أنشئ ثلاث صور جديدة تضعها في بيئات مختلفة تمامًا: سوق ليلي صاخب، ولوبي شركة أبيض معقم، وأرض قاحلة متربة.”
إجابة:

سايبربانك 2077 المشاعر. كان تصميم شخصية المحقق متسقًا عبر البيئات. يتم نقل البقع الموجودة على المعطف والندبة الموجودة على الجبهة والعديد من التفاصيل الأخرى باستمرار عبر المشاهد المختلفة.
هذا هو الشيء الذي عانى منه نانو بانانا.
المهمة 4: تحرير اللغة الطبيعية الدلالية

“التقط هذه الصورة وقم بتغيير الجو إلى أجواء السيرك. استبدل الملابس بالبدلات الرسمية. اجعلها كما لو كانوا في معرض تصوير. لا تغير الموضوع أو مكان تواجدهم في الصورة.”
إجابة:

معجب. لم يتم نقل الشخصية على الإطلاق. وغيرت ملابسهم حسب التعليمات بشكل طبيعي. تمكنت Nano Banana 2 من إجراء تجديد على هذه الصورة، دون تغيير عدد من عناصرها المرئية مثل شاحنة المياه والشجرة (إلى جانب الفتاة) ودخان المدخنة.
المهمة 5: موجه التأريض المباشر للطقس
“قم بإنشاء منظر واقعي من نافذة شقة مريحة تطل مباشرة على برج إيفل، مما يعكس بدقة الظروف الجوية الحية الفعلية اليوم في باريس.”
إجابة:

تبدو هذه الصورة كصورة إنستغرام عالية الجودة. إذا أخبرت صديقك أن هذه لقطة التقطتها أثناء تواجدك في باريس، فمن المحتمل أن يصدقك. كان الوقت والظروف الجوية في باريس حتى وقت إجراء هذا الاختبار 12:52 صباحا و غائم طقس. هذا المشهد يجسد هذه التفاصيل بشكل مثالي.
مراجعة نانو الموز 2
أثناء استخدام Nano Banana 2، قمت بالملاحظات التالية:
- خصوصية: Nano Banana 2 هي أداة مذهلة، إذا كنت تستطيع طرحها بشكل صحيح. اسأل وسوف تحصل! المثل القديم يلخص التجربة التي مررت بها في استخدامه. كلما كانت مطالباتك أكثر وضوحًا، كانت جودة الصورة الناتجة أفضل.
- الدرابزين: من بين كل قوتها، فإن Nano Banana 2 سيرفض تمامًا طلب الصورة الذي يحتوي على كيان محمي بحقوق الطبع والنشر في الموجه. تجنب استخدام أسماء الشركات أو أي شيء محدد يمكن أن يؤدي إلى تشغيل حاجز الحماية هذا.

- القيود: Nano Banana 2 متاح مجانًا لجميع مستخدمي طراز Gemini. لكن بعض الميزات مقفلة خلف الاشتراكات ويؤدي الاستخدام المجاني إلى تقييدها بسهولة تامة.

الأداء والمعايير
في حين أن الأرقام القياسية الدقيقة لا تزال مستقرة، فإن الاستقبال المبكر يضع Nano Banana 2 في أعلى قوائم المتصدرين للذكاء الاصطناعي المرئي مثل Arena.ai.
إنه يتفوق على سابقه، Gemini 2.5 Flash Image، عن طريق تقليل زمن الوصول بشكل كبير مع مطابقة التعليمات التالية والالتزام الفوري الذي كان محجوزًا مسبقًا فقط لنموذج Gemini 3.1 Pro Image الأثقل.
خاتمة
يمثل Nano Banana 2 تحولًا كبيرًا في كيفية تعاملنا مع توليد صور الذكاء الاصطناعي. ومن خلال إزالة الاحتكاك الناتج عن أوقات العرض الطويلة مع الحفاظ على الميزات المتقدمة مثل إنشاء نص مثالي واتساق الأحرف، فإنه ينهي بشكل فعال التسوية بين السرعة والجودة.
سواء كنت أحد مسوقي المؤسسات الذين يعملون على توطين الحملات الإعلانية العالمية أو منشئ المحتوى الذي ينشئ كتابًا هزليًا، فإن Nano Banana 2 في وضع يسمح له بأن يصبح المعيار الافتراضي الجديد للجيل المرئي.
الأسئلة المتداولة
ج: فهو يجمع بين سرعة مستوى الفلاش وإنشاء صور ذات جودة احترافية، مما يزيل المفاضلة المعتادة.
ج: نعم، يدعم ترجمة النص داخل الصورة دون تغيير التركيب أو الإضاءة.
ج: يحافظ على التناسق لما يصل إلى خمسة أحرف و14 كائنًا عبر سير العمل.
قم بتسجيل الدخول لمواصلة القراءة والاستمتاع بالمحتوى الذي ينظمه الخبراء.
Source link





