مع كل الاختراقات التي تحدث في معالجة الصور من خلال إصدارات مثل Nano Banana وQwen image وSAM3، فإن OpenAI التي كانت في مقدمة المجال قبل بضع سنوات، كانت هادئة نسبيًا – خاصة فيما يتعلق بإصداراتها. مع الإصدارات الأولية والعروض الباهتة، استبعد معظم الناس OpenAI من سباق الذكاء الاصطناعي.
لكن الابن الضال يعود! الجديد صور ChatGPT هنا. مدعومًا بنموذج توليد الصور الرائد الجديد، يطالب النموذج بأداء أفضل من أي وقت مضى. ستساعدك هذه المقالة في تعريفك بنموذج الصورة هذا، كما ستضع النموذج تحت الاختبار مقارنة بالنماذج المعاصرة له لمعرفة مدى جودة أدائه.
ما هي صورة GPT 1.5؟
ChatGPT Image 1.5 هو أحدث نموذج لتوليد الصور من OpenAI، وهو مصمم لتحويل الأفكار إلى صور مرئية بسرعة ودقة. سواء كان شخص ما يقوم بالإنشاء من مطالبة فارغة أو يقوم بتحرير صورة موجودة، فإن النموذج يقدم نتائج تتطابق بشكل وثيق مع الرؤية المقصودة. وهو يدعم عمليات التحرير الدقيقة مع الحفاظ على التفاصيل الدقيقة وينشئ صورًا أسرع بما يصل إلى 4 مرات من الإصدارات السابقة.
النموذج يأتي مع الجديد الصور تجربة داخل ChatGPT، والتي تتيح إنشاء الصور وتحسينها بسهولة.
11 مطالبة بتجربة ChatGPT Image-1.5: إنشاء الصور
تتفوق صورة ChatGPT في إنشاء الصور وتحريرها. في هذا القسم، سأحدد المطالبات العشرة التي سأختبر عليها مخرجات الصورة لصورة ChatGPT:
1. توليد صور واقعية
اِسْتَدْعَى:
قم بإنشاء رسم بياني تفصيلي لعمل وتدفق ماكينة القهوة الأوتوماتيكية مثل ماكينة جورا.
من سلة الفول إلى الطحن والقياس وخزان المياه والغلاية وما إلى ذلك.
أود أن أفهم التدفق من الناحية الفنية والبصرية.
إجابة:
لقد كافحت نماذج الصور لفترة طويلة لإنشاء نص مقروء. وهذا لا يفعل ذلك فحسب، بل يقرنه أيضًا بصور جذابة. يمكن لأي شخص حاول استخدام صورة تم إنشاؤها بواسطة الذكاء الاصطناعي معرفة الفرق في الجودة بين الصورة أعلاه عما كان متوقعًا. الرد دقيق كذلك.
لقد استخدمت هذه المطالبة على وجه التحديد كما تم ذكرها في دليل المطالبة الخاص بـ OpenAI، لاختبار استجابة النموذج، عند إعطائي نفس المطالبة.
2. إنشاء صور واقعية
اِسْتَدْعَى:
لقطة واقعية وصريحة لميكانيكي متمرس يأخذ استراحة في مرآب مزدحم مضاء بنور الشمس. كان يمسح الشحوم عن يديه بقطعة قماش قذرة، ويبدو مرهقًا ولكنه راضٍ. التركيز الشديد على نسيج الجلد: خطوط الوجه العميقة، والمسام، وخرز العرق، وبقع الشحوم على جبهته. يرتدي معطفًا أزرقًا باهتًا وملطخًا بالزيت مع رقعة اسم فضفاضة. تم التصوير على شريط سينمائي مقاس 35 مم باستخدام عدسة مقاس 50 مم على مستوى العين. يتدفق الضوء الطبيعي من خلال نافذة مغبرة، ويضيء جزيئات الغبار العائمة. عمق المجال الضحل يؤدي إلى تشويش محرك السيارة القديمة في الخلفية. لا يوجد تنقيح، خام وأصلي.
إجابة:
صورة مقنعة لميكانيكي عميق في العمل. الإضاءة على هذا الموضوع يضع حقا الواقعية في البيت.
3. إنشاء الشعار
اِسْتَدْعَى:
شعار متجه بسيط لفندق يُسمى “Bates Motel”. يتميز التصميم بـ “شبح” أو “روح قاتلة” لطيفة ومستديرة ومنمقة مع عيون أنيمي كاواي بسيطة، تحمل سكين جزار مثل العصا. التصميم مسطح ودافئ وخالد، ويذكرنا بتميمة Studio Ghibli ولكنه مبسط لشعار الشركة. خطوط نظيفة ومساحة سلبية وألوان البيج الدافئة والبني الترابي. خلفية بيضاء أو داكنة عادية.
إجابة:
شعار يوضح أنه يمكن أيضًا تقديم مفهوم غريب بطريقة ودية.
4. قصة للشريط الهزلي
اِسْتَدْعَى:
قصة مانغا هزلية عمودية مكونة من 4 لوحات، نمط فني لمذكرة الموت. يجب أن تشغل كل لوحة ربع مساحة الصورة بأكملها. اللوحة 1: لايت ياغامي يرتدي بدلة ويترك الغرفة بمظهر متعجرف بينما يجلس L في الخلف وهو يراقب. اللوحة 2: يغلق الباب. لقطة مقربة لوجه L، حاد ودقيق، ممسكًا بمكعب سكر أبيض. اللوحة 3: يجلس L على مكتب في غرفة فوضوية محاطة بالحلويات والمستندات، ويعمل بغضب. اللوحة 4: ينفتح الباب ويقف لايت ياجامي ويبدو مصدومًا ومهزومًا. يجلس “L” بهدوء ممسكًا بمذكرة الموت، ويبتسم بانتصار. تباين عالٍ، تظليل مانغا بالأبيض والأسود.
إجابة:
كانون راجع للشغل
يبدو الشريط الهزلي وكأنه الفصل الأخير من المانجا. نجح النموذج في إنشاء صفحة كتاب فكاهي مقنعة.
5. نماذج واجهة المستخدم
اِسْتَدْعَى:
نموذج بالحجم الطبيعي لواجهة المستخدم عالي الدقة وواقعي لتطبيق الهاتف المحمول الحديث لـ Farmers Market معروض على إطار iPhone 15.
الواجهة نظيفة وجيدة التهوية مع خلفية بيضاء ولمسات خضراء رقيقة.
القسم العلوي: عنوان يقول “Riverside Market” مع الحالة “مفتوح حتى الساعة 2 مساءً”. القسم الأوسط: عرض دائري “عروض اليوم الخاصة” يعرض صورًا نابضة بالحياة وعالية الدقة لطماطم الإرث والخبز الطازج. القسم السفلي: قائمة منظمة جيدًا بالبائعين مع صور شخصية مربعة مستديرة وعلامات فئة مثل “عضوي” و”مخبز”. الأسفل: شريط تنقل بسيط.
التصميم عملي وجميل، ويتميز بطباعة واضحة من نوع sans-serif وظلال ناعمة وجمالية مصقولة على طراز Dribbble.
إجابة:
من أفضل تطبيقات هذه التقنية. يمكن للمطورين الحصول على ملخص حول المنتج من خلال إنشاء نموذج أولي للمساعدة البصرية.
6. الرسم -> الصورة
اِسْتَدْعَى:
تحويل هذا الرسم إلى صورة واقعية. الحفاظ على التخطيط الدقيق والنسب والمنظور. اختر مواد وإضاءة واقعية تتوافق مع غرض الرسم. لا تقم بإضافة عناصر أو نص جديد.
إجابة:
يمكن أن يكون هذا أفضل ما يمكن أن يصنعه من رسمتي المصورة.
7. التجربة الافتراضية
اِسْتَدْعَى:
بشر
ملابس
قم بتحرير الصورة لتلبيس المرأة باستخدام صور الملابس المتوفرة. لا تغير وجهها أو ملامح وجهها أو لون بشرتها أو شكل جسمها أو وضعها أو هويتها بأي شكل من الأشكال. الحفاظ على شكلها الدقيق وتعبيرها وتسريحة شعرها ونسبها. استبدل الملابس فقط، مع ملاءمة الملابس بشكل طبيعي لوضعها الحالي وهندسة جسدها بسلوك نسيج واقعي. قم بمطابقة الإضاءة والظلال ودرجة حرارة اللون مع الصورة الأصلية بحيث يتكامل الزي بشكل واقعي، دون أن يبدو ملصوقًا. لا تقم بتغيير الخلفية أو زاوية الكاميرا أو الإطار أو جودة الصورة، ولا تقم بإضافة ملحقات أو نص أو شعارات أو علامات مائية.
إجابة:
صورة ممتعة، مع تبادل سلس للملابس.
8. إنشاء بلوشي ثلاثي الأبعاد
سأستخدم نفس صورة الإدخال (بشر) كالمثال السابق.
اِسْتَدْعَى:
قم بتحويل الموضوع أو الصورة إلى شكل رائع على شكل قطيفة بملمس ناعم وأبعاد مستديرة. إذا كان الشخص حاضرا، فاحتفظ بالسمات التي يمكن التعرف عليها؛ بخلاف ذلك، قم بإعادة تفسير الجسم أو الحيوان على أنه لعبة محشوة مريحة باستخدام نسيج اللباد أو الصوف. امنحها ملمسًا مريحًا أو صوفًا، وأشكالًا مبسطة، وتفاصيل مطرزة لطيفة للعينين والفم والملامح. استخدم لوحة ألوان دافئة أو باستيل أو محايدة مع تظليل ناعم وطبقات دقيقة، مثل لعبة محشوة مصنوعة يدويًا. حافظ على التعبير ودودًا ولطيفًا، مع رأس كبير جدًا وأطراف قصيرة وصورة ظلية محبوبة. يجب أن تبدو الصورة النهائية وكأنها لعبة قطيفة ساحرة وقابلة للتحصيل مريحة وصحية وقابلة للاحتضان، بينما لا يزال من الممكن التعرف عليها كموضوع أصلي.
إجابة:
يشبه القطيفة موضوع الصورة المدخلة ويحتفظ بالشخصية أثناء إنشائها: فخم!
9. بطاقة عطلة منبثقة ثلاثية الأبعاد
اِسْتَدْعَى:
رسم توضيحي مميز لبطاقة عطلة عيد الميلاد يعرض صورة مقربة لدب عتيق ولطيف بجوار شجرة عيد الميلاد. في الخلفية، بعيدًا عن التركيز، توجد أرض يحتفل فيها الناس. الإضاءة ناعمة وسينمائية مع عمق مجال ضحل لتسليط الضوء على نسيج الزخرفة. المزاج دافئ وحنين وعاطفي. يجب أن تتضمن الصورة النص “عيد ميلاد سعيد – أتمنى أن تكون أيامك سعيدة ومشرقة” مكتوبًا بخط رقيق ذهبي أنيق. صورة واقعية، دقة 8K، تكوين عالي الجودة للطباعة.
إجابة:
هذا شيء يمكن إرساله إلى أقاربنا. فهم جيد حقًا للمتطلبات التي يعرضها النموذج.
10. المعرفة العالمية
اِسْتَدْعَى:
أنشئ مشهدًا واقعيًا للجمهور في الهواء الطلق عند بوابة براندنبورغ في برلين ليلة 9 نوفمبر 1989. ملابس وعروض مسرحية وبيئة واقعية ودقيقة.
إجابة:
التاريخ له أهمية خاصة، لأنه يصادف سقوط جدار برلين. ولم يكن النموذج قادرا على التعرف على ذلك فحسب، بل كان قادرا أيضا على خلق صورة تجسد مشاعر الجماهير.
خاتمة
النموذج بالتأكيد لا يحد من إبداعك. يمكنك استخدام هذه المطالبات كقاعدة لإنشاء مطالبات محسّنة مصممة خصيصًا لتناسب عبء العمل لديك. مع وقت الاستجابة القصير والتوفر لجميع المستخدمين، فإن الاتجاه الذي تتجه إليه OpenAI مع أحدث إصدار لنموذج الصور الخاص بها واضح للغاية. يمكنك التلاعب بالمطالبات لمعرفة ما هو الأفضل بالنسبة لك.
الأسئلة المتداولة
س1. ما هو ChatGPT Image 1.5 وكيف يختلف عن الإصدارات السابقة؟
A. ChatGPT Image 1.5 هو أحدث نموذج لإنشاء الصور من OpenAI، وهو مصمم لتحقيق إخراج أسرع وتفاصيل أكثر وضوحًا وإجراء تعديلات أكثر دقة. فهو يولد صورًا أسرع بما يصل إلى أربع مرات مع الحفاظ على الدقة البصرية الدقيقة.
س2. ما هي أنواع المهام التي يؤدي فيها ChatGPT Image 1.5 أفضل أداء؟
ج: إنه يتفوق في إنشاء الصور الواقعية، والمشاهد الواقعية، ونماذج واجهة المستخدم، والقصص المصورة، وتحويل الرسم إلى صورة، وتعديلات الصور الدقيقة مثل المحاولات الافتراضية، كل ذلك مع الحفاظ على التخطيط والإضاءة ودقة التفاصيل.
س3. هل ChatGPT Image 1.5 مناسب للمستخدمين العاديين أم للمحترفين فقط؟
ج: إنها متاحة لجميع المستخدمين ومصممة للتكرار السريع، مما يجعلها مفيدة للمصممين والمطورين والمسوقين والمبدعين العاديين الذين يريدون صورًا عالية الجودة دون سير عمل معقد.
أنا متخصص في مراجعة وتحسين الأبحاث المستندة إلى الذكاء الاصطناعي والوثائق الفنية والمحتوى المتعلق بتقنيات الذكاء الاصطناعي الناشئة. تشمل خبرتي التدريب على نماذج الذكاء الاصطناعي، وتحليل البيانات، واسترجاع المعلومات، مما يسمح لي بصياغة محتوى دقيق تقنيًا ويمكن الوصول إليه.
قم بتسجيل الدخول لمواصلة القراءة والاستمتاع بالمحتوى الذي ينظمه الخبراء.