نموذج جديد.. جوجل تطلق Nano Banana لتغيير قواعد إنشاء الصور الرقمية

تقدم شركة Google DeepMind نموذج Nano Banana لتحرير الصور بالذكاء الاصطناعي، ليشكل نقلة نوعية في تحسين الصور عبر تطبيق Gemini، مما يعزز تجربة المستخدمين في تعديل الصور بدقة وواقعية تحافظ على الهوية البصرية للأشخاص والعناصر داخل الصور.

مميزات نموذج تحرير الصور Nano Banana في تطبيق Gemini

يتيح نموذج Nano Banana لمستخدمي Gemini نطاقًا واسعًا من الإمكانات في تحرير الصور، حيث يمكن تعديل الملابس والتسريحات بالإضافة إلى دمج الحيوانات الأليفة في مشاهد جديدة مع الحفاظ على تفاصيل الوجوه بدقة متناهية، وهذا بفضل التركيز على محاكاة الهوية البصرية الحقيقية للشخص أو العنصر المُصوّر؛ مما يجنب مشكلة التشابه غير الكامل التي تقلل من واقعية الصور الشخصية المُعدلة ويؤدي لتفاوت في تجسيد الشخصية عبر صور مختلفة. ويتميز النموذج بإمكانية إجراء تعديلات متعددة الخطوات، كما يمكن تغيير المشاهد تدريجيًا، مثل تغيير لون الجدران ثم إضافة أثاث مع احتفاظ بقية التفاصيل الأصلية، بالإضافة إلى دمج تصاميم من صور مختلفة كأن تضاف ألوان بتلات الزهور على حذاء أو تصميم فستان بنقشة جناح فراشة.

أداء نموذج Nano Banana وتقييماته بين نماذج تحرير الصور

أظهرت منصة LMArena أن نموذج Gemini 2.5 Flash Image المدعوم بنموذج Nano Banana تفوق على غيره من نماذج تعديل الصور مثل ChatGPT-4o، FLUX.1 Kontext، وQwen Image Edit من حيث إجمالي تفضيلات المستخدمين، مع موازنة مرضية في جودة الصور وسرعة الإنتاجية بالبكسل. في حين حقق الإصدار السابق Gemini 2.0 Flash Image سرعة إنتاجية أعلى، إلا أنه حصل على تقييمات أقل في جودة الصور وفئات التفضيل العامة مما يدل على تباين بين الأداء والسرعة عبر النسخ المختلفة. وعرضت البيانات مقارنة أداء بين النماذج عبر عدة فئات مثل إنتاج الشخصيات، الإبداع، الرسوم المعلوماتية، إعادة توظيف العناصر البيئية، حيث أظهر Gemini 2.5 تفوقًا واسعًا، بينما امتاز ChatGPT-4o في التنسيق البصري، وجاءت FLUX.1 Kontext في مرتبة متوسطة، بينما سجل Qwen Image Edit تراجعًا ملحوظًا في بعض الفئات.

طرائق استخدام Nano Banana وتوفره للمستخدمين والمطورين

تم إطلاق نموذج Nano Banana رسميًا لجميع مستخدمي تطبيق Gemini منذ يوم الثلاثاء، سواء في النسخة المجانية أو المدفوعة، بالإضافة إلى توافره تدريجيًا عبر واجهة برمجة التطبيقات Gemini API وبيئة Google AI Studio الخاصة بالمطورين، كما يتوفر داخل منصة Vertex AI الخاصة بمطوري المؤسسات. ويطبق Gemini وضع علامات مائية مرئية وعلامات رقمية خفية (SynthID) على كل صورة يتم إنشاؤها أو تعديلها، ما يؤكد أن الصور ناتجة عن الذكاء الاصطناعي مع المحافظة على الشفافية. ويأتي هذا الإطلاق بعد إعلان Google عن نموذج Imagen 4 المتطور خلال مؤتمر I/O 2025، الذي وفر تحسينات ملحوظة في توليد صور واقعية عالية الجودة مع تفاصيل محسنة.

النموذج التقييم العام إنتاجية البكسلات في الثانية مستوى رضا المستخدمين
Gemini 2.5 Flash Image (Nano Banana) الأعلى مرتفع عالي جدًا
Gemini 2.0 Flash Image أقل من Gemini 2.5 الأعلى متوسط
ChatGPT-4o جيد في التنسيق البصري متوسط جيد
FLUX.1 Kontext متوسط متوسط متوسط
Qwen Image Edit متراجع متوسط متراجع