تقدم شركة Google DeepMind نموذج Nano Banana لتحرير الصور بالذكاء الاصطناعي، ليشكل نقلة نوعية في تحسين الصور عبر تطبيق Gemini، مما يعزز تجربة المستخدمين في تعديل الصور بدقة وواقعية تحافظ على الهوية البصرية للأشخاص والعناصر داخل الصور.
مميزات نموذج تحرير الصور Nano Banana في تطبيق Gemini
يتيح نموذج Nano Banana لمستخدمي Gemini نطاقًا واسعًا من الإمكانات في تحرير الصور، حيث يمكن تعديل الملابس والتسريحات بالإضافة إلى دمج الحيوانات الأليفة في مشاهد جديدة مع الحفاظ على تفاصيل الوجوه بدقة متناهية، وهذا بفضل التركيز على محاكاة الهوية البصرية الحقيقية للشخص أو العنصر المُصوّر؛ مما يجنب مشكلة التشابه غير الكامل التي تقلل من واقعية الصور الشخصية المُعدلة ويؤدي لتفاوت في تجسيد الشخصية عبر صور مختلفة. ويتميز النموذج بإمكانية إجراء تعديلات متعددة الخطوات، كما يمكن تغيير المشاهد تدريجيًا، مثل تغيير لون الجدران ثم إضافة أثاث مع احتفاظ بقية التفاصيل الأصلية، بالإضافة إلى دمج تصاميم من صور مختلفة كأن تضاف ألوان بتلات الزهور على حذاء أو تصميم فستان بنقشة جناح فراشة.
أداء نموذج Nano Banana وتقييماته بين نماذج تحرير الصور
أظهرت منصة LMArena أن نموذج Gemini 2.5 Flash Image المدعوم بنموذج Nano Banana تفوق على غيره من نماذج تعديل الصور مثل ChatGPT-4o، FLUX.1 Kontext، وQwen Image Edit من حيث إجمالي تفضيلات المستخدمين، مع موازنة مرضية في جودة الصور وسرعة الإنتاجية بالبكسل. في حين حقق الإصدار السابق Gemini 2.0 Flash Image سرعة إنتاجية أعلى، إلا أنه حصل على تقييمات أقل في جودة الصور وفئات التفضيل العامة مما يدل على تباين بين الأداء والسرعة عبر النسخ المختلفة. وعرضت البيانات مقارنة أداء بين النماذج عبر عدة فئات مثل إنتاج الشخصيات، الإبداع، الرسوم المعلوماتية، إعادة توظيف العناصر البيئية، حيث أظهر Gemini 2.5 تفوقًا واسعًا، بينما امتاز ChatGPT-4o في التنسيق البصري، وجاءت FLUX.1 Kontext في مرتبة متوسطة، بينما سجل Qwen Image Edit تراجعًا ملحوظًا في بعض الفئات.
طرائق استخدام Nano Banana وتوفره للمستخدمين والمطورين
تم إطلاق نموذج Nano Banana رسميًا لجميع مستخدمي تطبيق Gemini منذ يوم الثلاثاء، سواء في النسخة المجانية أو المدفوعة، بالإضافة إلى توافره تدريجيًا عبر واجهة برمجة التطبيقات Gemini API وبيئة Google AI Studio الخاصة بالمطورين، كما يتوفر داخل منصة Vertex AI الخاصة بمطوري المؤسسات. ويطبق Gemini وضع علامات مائية مرئية وعلامات رقمية خفية (SynthID) على كل صورة يتم إنشاؤها أو تعديلها، ما يؤكد أن الصور ناتجة عن الذكاء الاصطناعي مع المحافظة على الشفافية. ويأتي هذا الإطلاق بعد إعلان Google عن نموذج Imagen 4 المتطور خلال مؤتمر I/O 2025، الذي وفر تحسينات ملحوظة في توليد صور واقعية عالية الجودة مع تفاصيل محسنة.
النموذج | التقييم العام | إنتاجية البكسلات في الثانية | مستوى رضا المستخدمين |
---|---|---|---|
Gemini 2.5 Flash Image (Nano Banana) | الأعلى | مرتفع | عالي جدًا |
Gemini 2.0 Flash Image | أقل من Gemini 2.5 | الأعلى | متوسط |
ChatGPT-4o | جيد في التنسيق البصري | متوسط | جيد |
FLUX.1 Kontext | متوسط | متوسط | متوسط |
Qwen Image Edit | متراجع | متوسط | متراجع |
بالفيديو: قصة طفل غزاوي يكافح الجوع بجمع الطحين الممزوج بالتراب—كيف يؤثر هذا الواقع على المجتمع؟
مذنب يقترب من النظام الشمسي.. كشف جديد يثير قلق العلماء حول الضوء الغامض اليوم
«زيادة مضمونة» متى يتم صرف زيادة رواتب المتقاعدين ليبيا وما هي الفئات المستحقة؟
رسميًا.. أسماء حكام الجولة الأولى من الدوري الأردني 2025 اليوم
«موعد البطولة» موعد مباراة مصر ضد جنوب السودان في أفروباسكت للسيدات
رسميًا.. موقف مانشستر سيتي من إيدرسون ودوناروما خلال 48 ساعة الماضية
30 يوليو 2025: قفزة في ترقية مساعدي النيابة العامة وتعيين قضاة جدد.. تعرف على الأسماء كاملة
«فرصة ذهبية» سعر تذكرة حديقة الحيوان بالجيزة وقرب افتتاحها الجديد ماذا يتوقع الزوار؟