أعلنت جوجل عن إطلاق أحدث إصداراتها في مجال الذكاء الاصطناعي Gemini 2.5 Flash (المعروف أيضًا باسم nano-banana)، والذي طورته وحدة Google DeepMind ليكون واحدًا من أقوى النماذج في العالم لتوليد وتحرير الصور.
ويتميز النموذج الجديد بمزيج من السرعة، والجودة العالية، والتحكم الدقيق، مع توفيره للمستخدمين عبر تطبيق Gemini، وأداة Google AI Studio للمطورين، ومنصة Vertex AI للشركات.
قدرات متقدمة على التحرير
يتيح Gemini 2.5 Flash للمستخدمين إنشاء صور متعددة للشخصيات أو المنتجات نفسها مع الحفاظ على الاتساق البصري والملامح الأصلية. كما يمكنه:
-
تجربة أوضاع وتسريحات وأزياء جديدة للشخصيات.
-
دمج صور مختلفة في مشهد واحد متكامل.
-
إجراء تعديلات متسلسلة خطوة بخطوة على الصور.
-
نقل التصاميم والأنماط من صورة لأخرى بدقة عالية.
أبرز المزايا
-
الحفاظ على اتساق الهوية البصرية في الحملات التسويقية.
-
تنفيذ الأوامر النصية مثل طمس الخلفيات، حذف العناصر، أو تلوين الصور القديمة.
-
فهم السياق الواقعي بفضل قاعدة معرفية عميقة، مما يجعله مثاليًا للتصميم الداخلي والأزياء.
-
دمج الصور في صورة واحدة بجودة فائقة.
السعر والتوفر
أصبح النموذج متاحًا للمطورين والشركات بسعر 30 دولارًا لكل مليون رمز إخراج، فيما تعادل تكلفة توليد صورة واحدة نحو 0.039 دولار فقط.
أما عبر تطبيق Gemini، فيمكن للمستخدمين تجربة القدرات مباشرة باستخدام الأوامر النصية، مع إضافة علامات مائية مرئية وغير مرئية لتوضيح أن الصور مُنتَجة عبر الذكاء الاصطناعي.
أمثلة عملية
نشرت جوجل مجموعة صور توضح إمكانات النموذج الجديد، تضمنت:
-
تغيير إكسسوارات الرأس إلى زهور.
-
إظهار الشخص نفسه في مهن مختلفة.
-
تعديل ألوان وصور الحيوانات.
-
إعادة تصميم غرف داخلية بألوان وديكورات جديدة.
-
ترميم الصور القديمة بجودة عالية.