7 نوفمبر 2025
تدمج HubX نموذج Gemini 2.5 Flash Image لتعديل الصور بشكل سريع ومناسب للسياق في تطبيق ReShoot
HubX هي مركز تكنولوجي عالمي يخدم أكثر من 300 مليون مستخدم من خلال مجموعة تطبيقاته على الأجهزة الجوّالة. عند تطوير تطبيقهم الأخير ReShoot، كان هدفهم إتاحة أدوات تحرير الصور الاحترافية للجميع باستخدام الذكاء الاصطناعي التوليدي. من خلال الاستفادة من Gemini API، حقّق الفريق سرعة تطوير ملحوظة، إذ انتقل بالمشروع من بداية تطوير الحد الأدنى من المنتج القابل للتطبيق إلى إطلاقه على أجهزة iOS في غضون أسبوعين فقط. بعد فترة وجيزة، تصدّر تطبيق ReShoot المرتبة الأولى في فئة "الرسومات والتصميم" على App Store في الولايات المتحدة.
يهدف التطبيق إلى السماح للمستخدمين بتغيير المشهد أو نمط الصورة بدون فقدان المظهر الطبيعي وهوية الموضوع الأصلي. بالنسبة إلى المطوّرين، يمثّل تقديم هذا المستوى من التفكير المعقّد والمتعدد الوسائط ضمن متطلبات وقت الاستجابة المنخفض الصارمة لتجربة الأجهزة الجوّالة تحديًا كبيرًا على مستوى التصميم. ولحلّ هذه المشكلة، استخدمت HubX واجهة برمجة التطبيقات Gemini API لإنشاء مسار متطوّر لتعديل الصور يجمع بين الفهم السياقي العالي الدقة وسرعة الاستنتاج الاستثنائية.
تعديل الصور بدقة عالية باستخدام Nano Banana
لإنشاء محرك الاستدلال الذي يستند إليه ReShoot، تعاونت HubX مع فريق Google لدمج Gemini 2.5 Flash Image، المعروف أيضًا باسم Nano Banana.
من التحديات التقنية الأساسية في إنشاء صور من صور أخرى الحفاظ على هوية الموضوع أثناء تفسير طلبات المشاهد المعقّدة. على عكس مسارات المعالجة التقليدية التي تتطلّب غالبًا ربط نماذج منفصلة للتفكير النصي وتجميع الصور، فإنّ Gemini 2.5 Flash Image متعدّد الوسائط بشكلٍ أساسي. تعالج هذه الأداة الطلبات النصية ومدخلات الصور في خطوة واحدة موحّدة.
تتيح هذه البنية لـ ReShoot إجراء تعديلات حوارية (صورة + تحويل النص إلى صورة) مع الالتزام الشديد بطلبات المستخدمين مع الحفاظ على الهوية الأساسية وسياق الصور التي تم تحميلها. بالمقارنة مع البدائل التي تم اختبارها، تبيّن لشركة HubX أنّ نموذج Gemini يقدّم فهمًا بصريًا فائقًا واتساقًا متعدّد الوسائط.
تقليل وقت استجابة التطبيق بنسبة %40
مع أنّ إنشاء صور عالية الدقة أمر ضروري، يتوقّع مستخدمو الأجهزة الجوّالة الحصول على نتائج فورية تقريبًا. فأي صعوبة في العملية الإبداعية يمكن أن تؤدي إلى فقدان التفاعل.
من خلال استخدام Gemini 2.5 Flash Image كمعيار، تمكّنت HubX من خفض متوسط وقت الاستجابة لتعديل الصور ومعالجتها بنسبة %40 تقريبًا. يؤدي هذا الانخفاض الكبير في وقت الاستجابة إلى تحويل تجربة المستخدم من حالة انتظار سلبية إلى عملية إبداعية سلسة، وهو أمر ضروري للحفاظ على المستخدمين في تطبيقات الأجهزة الجوّالة المخصّصة للمستهلكين.
تبسيط مهام سير عمل التطوير
بالإضافة إلى تحسين الأداء بشكل فوري، أدّى دمج Gemini API إلى تبسيط بنية تطوير HubX بشكل كبير. يستخدم الفريق Google AI Studio لإنشاء نماذج أولية لسلاسل الطلبات واختبارها قبل نشرها في مرحلة الإنتاج من خلال حِزم Node.js مخصّصة مرتبطة بخادم الخلفية للأجهزة الجوّالة.
قبل استخدام نماذج Gemini، كانت المهام التي تتضمّن تفسير البيانات المتعدّدة الوسائط تتطلّب غالبًا منطقًا مخصّصًا معقّدًا أو ربط نماذج مختلفة. من خلال استخدام Gemini 2.5 Flash Image، دمجت HubX هذه المهام في إطار نمذجة واحد ومتسق، ما قلّل من تعقيد البنية مع تحسين سرعة الاستدلال.
الخطوات التالية
بعد الدمج الناجح لواجهة برمجة التطبيقات Gemini API، لاحظت HubX زيادة في تفاعل المستخدمين، كما يتضح من ارتفاع معدلات الحفظ والإعجاب بالمحتوى الذي تم إنشاؤه. وفي المستقبل، يخطّطون لتطوير ReShoot من أداة ذات غرض واحد إلى منصة شاملة لتعديل الصور بسلاسة.
يوضّح تطبيق HubX كيف يمكن للمطوّرين الاستفادة من السرعة والإمكانات المتعددة الوسائط الأصلية في Gemini API لإنشاء تطبيقات سهلة الاستخدام وعالية الأداء تلبي متطلبات مستخدمي الأجهزة الجوّالة.
لبدء الإنشاء باستخدام نماذج Gemini، يمكنك الاطّلاع على مستندات إنشاء الصور.