12 ديسمبر 2025
تحافظ Toongether على اتساق الأسلوب الفني باستخدام Gemini 2.5 Flash Image
أتاح ظهور الذكاء الاصطناعي التوليدي آفاقًا جديدة للتعبير الإبداعي، ما سمح للمطوّرين بإنشاء أدوات تحوّل المستخدمين العاديين إلى فنانين. ومع ذلك، في ما يتعلق بالفن التسلسلي، مثل القصص المصوّرة، لا يقتصر التحدي على إنشاء صورة جيدة واحدة، بل يشمل أيضًا إنشاء شخصيات وأساليب وروايات متسقة في عشرات اللوحات.
تعمل شركة Toongether، وهي الشركة التي تقف وراء تطبيق القصص المصوّرة على الويب، على مواجهة هذا التحدّي بشكل مباشر. تتمثّل مهمة الشركة في إتاحة سرد القصص المرئية للجميع، وتوفير منصة لا يمكن للمستخدمين العاديين من خلالها قراءة القصص المصوّرة فحسب، بل إنشاءها ومشاركتها مباشرةً من أجهزتهم الجوّالة أيضًا. ومن خلال دمج Gemini 2.5 Flash Image في مسار إنشاء المحتوى، يساعدون المستخدمين في التغلّب على العقبات الفنية التي تواجههم عند الرسم، ما يتيح لمجموعة جديدة من روّاد صناعة القصص المشاركة في إنشاء المحتوى.
تحقيق الاتساق على نطاق واسع
يتطلّب إنشاء كتاب مصوّر اتساقًا دقيقًا. يجب أن تظل الشخصيات قابلة للتمييز في مختلف الوضعيات والملابس وتعبيرات الوجه، مع الالتزام بأسلوب فني موحّد.
في البداية، اعتمد فريق toongether على مجموعة معقّدة من الأدوات، بما في ذلك نموذج Stable Diffusion XL معدّل بدقة ومحسّن باستخدام أدوات مثل ControlNet وIPAdapters. على الرغم من أنّ هذه الطريقة حقّقت نتائج نوعية، إلا أنّها واجهت مشاكل في وقت الاستجابة والمرونة، ما شكّل عوائق كبيرة أمام مطوّري التطبيقات على الأجهزة الجوّالة. كان يستغرق إنشاء صورة واحدة ما بين 20 و30 ثانية، وهو وقت طويل جدًا لتقديم تجربة سلسة للمستخدم. بالإضافة إلى ذلك، كانت إضافة دعم لوضعيات أو أساليب رسم جديدة تتطلّب جهدًا هندسيًا كبيرًا، ما يحدّ من قدرة الفريق على تكرار العمل بسرعة.
تنظيم عمليات معقّدة باستخدام Gemini
للتغلّب على هذه المشاكل، نقلت شركة toongether مسار إنشاء الصور الأساسي إلى Gemini API. وقد اختاروا Gemini 2.5 Flash Image، المعروف أيضًا باسم "Nano Banana" بسبب سرعته ومرونته، والذي يوفّر إمكانات فائقة في التعديل واتّباع التعليمات اللازمة للتعامل مع مهام الإنشاء المعقّدة والمتعدّدة الخطوات.
أدّى الانتقال إلى تسريع وتيرة التطوير بشكل كبير، إذ انتقل الفريق من نموذج أولي إلى تنفيذ كامل للإنتاج في غضون أسبوعين فقط.
للحفاظ على اتساق الشخصية مع السماح للمستخدمين بتخصيصها، استخدمت toongether نموذج Gemini 2.5 Flash Image لإنشاء مسار معقّد ومتعدّد المراحل:
- تحليل الأسلوب وإنشاء المراجع: عندما ينشئ المستخدم شخصية جديدة، يقدّم التطبيق إلى النموذج قائمة منسّقة من الشخصيات المرجعية لتحليل الأسلوب المطلوب. استنادًا إلى وصف نصي بسيط، ينشئ النموذج صورة مرجعية "لوضع محايد" لهذه الشخصية الأصلية الجديدة.
- حِزم مواد العرض وإنشاء الوضعيات: لوضع هذه الشخصية في قصة، تستخدم toongether "حِزم مواد العرض"، وهي عبارة عن قوائم مجمّعة من الأوصاف للوضعيات وحالات الاستخدام المطلوبة. باستخدام طلب يتضمّن تعليمات مع الصورة المرجعية المحايدة، يمكنهم توجيه Gemini 2.5 Flash Image لإنشاء سيناريوهات محدّدة بدون فقدان الهوية المرئية للشخصية.
- تركيب المشهد: بالنسبة إلى الخلفيات والعناصر الأخرى، يقدّم الفريق صورًا مرجعية لاستنتاج النمط الفني الصحيح، ما يضمن الحصول على لوحات متماسكة.
يقول سمير ناصر الدين، المؤسس المشارك في toongether: "من خلال الاستفادة من إمكانات التعديل والتعليمات المتقدّمة في Gemini 2.5 Flash Image، تمكّنا من تلبية جميع حالات الاستخدام لدينا". "أصبحت هذه الميزة الآن جزءًا أساسيًا من عمليات إنشاء الصور".
ما هي الخطوة التالية بشأن toongether؟
بعد أن أصبحت العناصر الأساسية جاهزة، يتطلّع فريق toongether إلى إضافة ميزات سردية متقدّمة كان يُعتقد سابقًا أنّها تتطلّب الكثير من الموارد. ويخططون لاستخدام نماذج Gemini لدعم التفاعلات المعقّدة بين شخصيات متعددة في لوحة واحدة ولإتاحة مجموعة أكبر من أساليب الرسم.
توضّح رحلة Toongether كيف تساعد واجهة برمجة التطبيقات Gemini API المجموعة التالية من المطوّرين في تجاوز إدارة حِزم النماذج المعقّدة إلى إنشاء أدوات إبداعية متطورة ومتسقة يمكن للمستخدمين العاديين الاستفادة منها.
لبدء إنشاء تطبيقات إبداعية خاصة بك باستخدام نماذج Gemini، يمكنك الاطّلاع على مستندات واجهة برمجة التطبيقات.