يُعيد نموذج “نانو بانانا” الذي كشفته جوجل مؤخرًا تعريف إمكانيات تعديل الصور باستخدام الذكاء الاصطناعي، حيث بقي هذا النموذج غامضًا لفترة قبل أن يستحوذ على اهتمام الخبراء والمبدعين حول العالم؛ فهو يقدم نفسه كبديل متطور لبرنامج فوتوشوب، لكن مع فارق جوهري يتمثل في سهولة الاستخدام عبر الأوامر النصية البسيطة، التي تحول الأفكار إلى تعديلات بصرية دقيقة على الصور.
يأتي “نانو بانانا”، الذي يُعرف رسميًا باسم “جيميناي 2.5 فلاش إيميج”، كامتداد مُحسّن للمزايا التي قدمتها جوجل سابقًا في تطبيق “جيميناي”، مدعيةً أنه يتجاوز النماذج السابقة في دقته وقدرته على الحفاظ على أصالة الصور؛ وتواجه أدوات تعديل الصور باستخدام الذكاء الاصطناعي التقليدية تحديًا كبيرًا يتمثل في فقدان التفاصيل الدقيقة عند إجراء التعديلات، مما يؤدي غالبًا إلى إنتاج صورة جديدة كليًا تختلف عن الأصل، لكن جوجل تؤكد أنها تغلبت على هذه المشكلة بشكل كبير في نموذجها الجديد.
كيف يتفوق نانو بانانا في تعديل الصور باستخدام الذكاء الاصطناعي؟
يكمن تفوق نموذج “نانو بانانا” في قدرته الاستثنائية على الاحتفاظ بتفاصيل الصورة الأصلية حتى بعد خضوعها لسلسلة من التعديلات المعقدة، ويظهر هذا بوضوح عند التعامل مع الصور التي تحتوي على وجوه بشرية، حيث يمكن للمستخدم تعديل ملابس الشخص أو تغيير الخلفية بالكامل دون المساس بملامح الوجه أو هويته البصرية؛ وهذه الميزة لا تقتصر على الحفاظ على التفاصيل فحسب، بل تمكّن النموذج من القيام بعمليات تخيل إبداعية، مثل تصور شكل شخص ما بعد مرور عشر سنوات، وذلك بمجرد تزويده بصوره الحالية، مما يفتح الباب أمام تجارب بصرية فريدة تعجز عنها أدوات تعديل الصور باستخدام الذكاء الاصطناعي الأخرى.
إن هذه الدقة الفائقة في التعامل مع الأوامر النصية تمنح النموذج مرونة لتحرير الصور من القيود المعتادة للذكاء الاصطناعي، مما يسمح بتوليد أفكار وأشكال مبتكرة؛ فبفضل قدرته على فهم الأوامر المتتالية، يمكن للمستخدم إضافة تحسينات مستمرة على نفس الصورة دون أن تفقد جوهرها، حيث استعرضت جوجل هذه الخاصية عبر دمج صورة لسيدة مع كلب، ثم تغيير خلفيتهما لتصبح ملعب كرة سلة، وكل ذلك مع الحفاظ على تناسق العناصر وواقعيتها البصرية، وهو ما يمثل نقلة نوعية في مجال تعديل الصور باستخدام الذكاء الاصطناعي.
استخدامات مبتكرة لنموذج تعديل الصور باستخدام الذكاء الاصطناعي
تتجاوز إمكانيات “نانو بانانا” مجرد التعديلات البسيطة لتقدم حلولًا عملية وإبداعية في مختلف المجالات، وتعتبر قدرته على فهم السياق البصري وحفظ التفاصيل هي حجر الزاوية في هذه الاستخدامات المتنوعة؛ فمن خلال دمج الصور المتعددة معًا، يستطيع النموذج إنشاء صورة جديدة تمامًا تجمع بين أفضل عناصر الصور الأصلية، حتى لو كانت هذه العناصر لأشخاص مختلفين في بيئات متباينة، وهذه الميزة وحدها تفتح آفاقًا جديدة للمصممين وصناع المحتوى الذين يسعون لإنتاج مشاهد فريدة ومعبرة.
تتنوع تطبيقات هذا النموذج لتشمل مجالات عملية وترفيهية واسعة، حيث أصبح بالإمكان الاستفادة منه في مهام كانت تتطلب في السابق خبرة فنية وبرامج معقدة، وتشمل أبرز هذه الاستخدامات ما يلي:
- دمج صور متعددة لإنشاء مشهد واحد متكامل.
- توليد شخصيات جديدة يمكن تحريكها لاحقًا باستخدام أدوات أخرى.
- تجربة ملابس مختلفة افتراضيًا على صور شخصية.
- تحويل أي نمط أو نقش في صورة إلى تصميم فني أو قطعة ملابس.
- تعديل النصوص المكتوبة داخل الصور مع الحفاظ على جودتها.
- إنشاء مشاهد إعلانية متكاملة عبر الأوامر النصية فقط.
- استعادة الصور القديمة التالفة أو المشوشة وتحسين جودتها.
طريقة استخدام نانو بانانا ومستقبله في تعديل الصور
يمثل النموذج الجديد ثورة حقيقية للفنانين المستقلين وصناع الأفلام، حيث يوفر عليهم الوقت والجهد والتكلفة المرتبطة بتصميم المشاهد والشخصيات يدويًا أو عبر التصوير التقليدي؛ فبدلًا من قضاء ساعات طويلة في الرسم أو التقاط الصور ثم تحريكها، يمكنهم الآن توليد أصول بصرية جاهزة للتحريك في ثوانٍ معدودة، ومن المتوقع أن ينتشر استخدام النموذج في العديد من الأعمال الفنية والسينمائية خلال السنوات القادمة، مما سيعزز من سرعة الإنتاج ويحرر الطاقات الإبداعية للتركيز على السرد القصصي، ويعد الوصول إلى “نانو بانانا” بسيطًا للغاية، فهو متاح مباشرةً عبر تطبيق “جيميناي” من جوجل، حيث يمكن للمستخدمين إضافة صورهم إلى نافذة الدردشة وطلب التعديلات التي يرغبون بها، مما يجعل عملية تعديل الصور باستخدام الذكاء الاصطناعي في متناول الجميع.
بفضل هذه القدرات المتكاملة وسهولة الوصول إليها، لا يقتصر تأثير النموذج على خبراء التصميم فحسب، بل يمتد ليشمل المستخدم العادي الذي أصبح بإمكانه الآن تنفيذ أفكار بصرية معقدة، مما يمهد الطريق لمرحلة جديدة من الإبداع الرقمي الشخصي والاحترافي.