تقدم شركة Google DeepMind نموذج Nano Banana لتحرير الصور بالذكاء الاصطناعي، ليشكل نقلة نوعية في تحسين الصور عبر تطبيق Gemini، مما يعزز تجربة المستخدمين في تعديل الصور بدقة وواقعية تحافظ على الهوية البصرية للأشخاص والعناصر داخل الصور.
مميزات نموذج تحرير الصور Nano Banana في تطبيق Gemini
يتيح نموذج Nano Banana لمستخدمي Gemini نطاقًا واسعًا من الإمكانات في تحرير الصور، حيث يمكن تعديل الملابس والتسريحات بالإضافة إلى دمج الحيوانات الأليفة في مشاهد جديدة مع الحفاظ على تفاصيل الوجوه بدقة متناهية، وهذا بفضل التركيز على محاكاة الهوية البصرية الحقيقية للشخص أو العنصر المُصوّر؛ مما يجنب مشكلة التشابه غير الكامل التي تقلل من واقعية الصور الشخصية المُعدلة ويؤدي لتفاوت في تجسيد الشخصية عبر صور مختلفة. ويتميز النموذج بإمكانية إجراء تعديلات متعددة الخطوات، كما يمكن تغيير المشاهد تدريجيًا، مثل تغيير لون الجدران ثم إضافة أثاث مع احتفاظ بقية التفاصيل الأصلية، بالإضافة إلى دمج تصاميم من صور مختلفة كأن تضاف ألوان بتلات الزهور على حذاء أو تصميم فستان بنقشة جناح فراشة.
أداء نموذج Nano Banana وتقييماته بين نماذج تحرير الصور
أظهرت منصة LMArena أن نموذج Gemini 2.5 Flash Image المدعوم بنموذج Nano Banana تفوق على غيره من نماذج تعديل الصور مثل ChatGPT-4o، FLUX.1 Kontext، وQwen Image Edit من حيث إجمالي تفضيلات المستخدمين، مع موازنة مرضية في جودة الصور وسرعة الإنتاجية بالبكسل. في حين حقق الإصدار السابق Gemini 2.0 Flash Image سرعة إنتاجية أعلى، إلا أنه حصل على تقييمات أقل في جودة الصور وفئات التفضيل العامة مما يدل على تباين بين الأداء والسرعة عبر النسخ المختلفة. وعرضت البيانات مقارنة أداء بين النماذج عبر عدة فئات مثل إنتاج الشخصيات، الإبداع، الرسوم المعلوماتية، إعادة توظيف العناصر البيئية، حيث أظهر Gemini 2.5 تفوقًا واسعًا، بينما امتاز ChatGPT-4o في التنسيق البصري، وجاءت FLUX.1 Kontext في مرتبة متوسطة، بينما سجل Qwen Image Edit تراجعًا ملحوظًا في بعض الفئات.
طرائق استخدام Nano Banana وتوفره للمستخدمين والمطورين
تم إطلاق نموذج Nano Banana رسميًا لجميع مستخدمي تطبيق Gemini منذ يوم الثلاثاء، سواء في النسخة المجانية أو المدفوعة، بالإضافة إلى توافره تدريجيًا عبر واجهة برمجة التطبيقات Gemini API وبيئة Google AI Studio الخاصة بالمطورين، كما يتوفر داخل منصة Vertex AI الخاصة بمطوري المؤسسات. ويطبق Gemini وضع علامات مائية مرئية وعلامات رقمية خفية (SynthID) على كل صورة يتم إنشاؤها أو تعديلها، ما يؤكد أن الصور ناتجة عن الذكاء الاصطناعي مع المحافظة على الشفافية. ويأتي هذا الإطلاق بعد إعلان Google عن نموذج Imagen 4 المتطور خلال مؤتمر I/O 2025، الذي وفر تحسينات ملحوظة في توليد صور واقعية عالية الجودة مع تفاصيل محسنة.
النموذج | التقييم العام | إنتاجية البكسلات في الثانية | مستوى رضا المستخدمين |
---|---|---|---|
Gemini 2.5 Flash Image (Nano Banana) | الأعلى | مرتفع | عالي جدًا |
Gemini 2.0 Flash Image | أقل من Gemini 2.5 | الأعلى | متوسط |
ChatGPT-4o | جيد في التنسيق البصري | متوسط | جيد |
FLUX.1 Kontext | متوسط | متوسط | متوسط |
Qwen Image Edit | متراجع | متوسط | متراجع |
كل ما يجب معرفته عن لعبة الحبار 2025: خطوات اللعب، طريقة التحميل، وأبرز المميزات
اضبط الآن تردد قناة وناسة 2025 الجديد على النايل سات وعرب سات بجودة HD مجانا
قفزة 9% في أسهم الأندية الرياضية السعودية تثير اندفاع المستثمرين بقوة اليوم
«مشاركة واسعة» هاكاثون عسير تبتكر 2025 يشعل طموحات المبتكرين في المنطقة
قفزة أسعار الذهب في السعودية الأحد 20 يوليو 2025.. كم بلغ سعر الغرام اليوم؟
إسماعيل بن ناصر يشغل الجماهير: هل ينتقل إلى الاتحاد السعودي في شتاء 2024؟
هبوط سعر الذهب عيار 21 في الكويت اليوم 6-8-2025 إلى 29 ألف دينار… كم وصل الانخفاض؟
رفض قاطع.. قرار رابطة لاعبي الدوري الإسباني يحظر بث مباراة برشلونة وفياريال خارج الأراضي الإسبانية