مشاركة

11 كانون الأول (ديسمبر) 2024

إعادة ابتكار إنشاء الفيديوهات باستخدام نموذج Gemini 2.0 Flash

فيشال دارماديكاري

مهندس حلول المنتجات

هانغ تشو

Viggle

الصورة الرئيسية لعرض Viggle

لا تعمل واجهة برمجة التطبيقات Gemini API على تحسين التطبيقات فحسب، بل تساهم أيضًا في إحداث ثورة في التعبير الإبداعي. Viggle هو تطبيق فيديو رائج يستخدم الذكاء الاصطناعي ويسمح لأي مستخدم بتحويل الصور إلى صور متحركة جذابة، وهو في طليعة هذه الثورة. من خلال تجربة سحر Gemini 2.0 Flash المتعدد الوسائط، والذي يتوفّر حاليًا في إصدار تجريبي فقط، وتحديدًا ميزات فهم الفيديوهات وإخراج الصوت المتقدّمة إلى جانب إنشاء الصور من خلال Imagen 3، تعمل Viggle على إنشاء ميزات تتيح للمستخدمين تحويل خيالهم إلى واقع بسهولة وبطرق لم تكن متاحة من قبل.

Inside Viggle: تحسين إنشاء الفيديوهات باستخدام الذكاء الاصطناعي من خلال Gemini 2.0 Flash وImagen 3

لقد جذب تطبيق Viggle ملايين المستخدمين بفضل قدرته على تحويل الصور الثابتة بسهولة إلى فيديوهات متحركة تُظهر حركة الجسم بالكامل، ما يؤدي إلى نشر المحتوى بشكل فيروسي على منصات وسائل التواصل الاجتماعي. توفّر منصة Viggle تطبيقات متوافقة مع الأجهزة الجوّالة (iOS وAndroid) ومنصّة ويب (viggle.ai)، مع التركيز على محتوى المحتوى المميّز والرقص. إنّ ميزات مثل تبديل الوجوه وإضافة صور متحركة باستخدام حركات رقص وإدراج المستخدمين في مشاهد الأفلام تحظى بشعبية كبيرة لدى قاعدة مستخدمي Viggle، وهم يستكشفون الآن طرقًا جديدة لتعزيز الإبداع إلى مستوى أعلى.

تعمل شركة Viggle حاليًا على إنشاء نماذج أولية لميزتَين تستفيدان من إمكانات Gemini 2.0 Flash وImagen 3:


  • تحويل الصور إلى شخصيات فيديو افتراضية: تستخدم شركة Viggle أداة Imagen 3 لإنشاء صور من أجل إنشاء شخصيات افتراضية مستندة إلى الذكاء الاصطناعي. يمكن للمستخدمين تقديم طلبات نصية بسيطة، مثل "روبوت يرقص وعيناه متوهجتان" أو "تنين رقيق بألوان قوس قزح"، وسينشئ النموذج شخصيات افتراضية فريدة جاهزة للظهور في فيديوهاتهم. ويتم بعد ذلك دمج هذه الشخصيات بسلاسة في محرّك الرسوم المتحركة في Viggle، ما يفتح آفاقًا واسعة من إمكانيات القصص المخصّصة. تخيل أنّك تقدّم فيلمًا قصيرًا متحرّكًا من إخراجك وبطولة شخصيات من وحي خيالك، فهذا هو ما تقدّمه لك أداتا Viggle وImagen 3.

  • السرد الديناميكي بالذكاء الاصطناعي: تستفيد Viggle أيضًا من قدرة Gemini 2.0 Flash على إنشاء الكلام وفهم الفيديو بشكلٍ معمّق، لتطوير ميزة تضيف تعليقات صوتية غنية بالسياق إلى أي فيديو. لا يقتصر الأمر على صوت أحادي النغمة يقرأ نصًا، بل هو ميزة رواية قصص باستخدام الذكاء الاصطناعي (AI) تحلِّل محتوى الفيديو، وترصد اللحظات الرئيسية والإجراءات وحتى المشاعر، لإنشاء سرد يكمّل الصور المرئية بشكلٍ مثالي. سواء كان تعليقًا مضحكًا على فيديو رقص أو وصفًا ملحميًا لمشهد خيالي، يضيف الراوي المستنِد إلى الذكاء الاصطناعي بعدًا جديدًا تمامًا للتفاعل.

الوصول إلى مستويات جديدة من الإبداع والتفاعل

من خلال دمج الذكاء الاصطناعي التوليدي، نسعى إلى تحسين تجربة Viggle بعدة طرق رئيسية:


  • إنشاء الشخصيات بشكلٍ مبسط: تعمل ميزة إنشاء الصور في Imagen 3 على تبسيط عملية إنشاء شخصيات الفيديو وتخصيصها. يمكن للمستخدمين الآن إنشاء شخصيات فريدة استنادًا إلى أفكارهم، ما يغنيهم عن امتلاك مهارات تصميم متقدّمة أو الاعتماد على خيارات محدودة مُعدّة مسبقًا. يتيح سير العمل المبسّط هذا لعدد أكبر من المستخدمين تنفيذ أفكارهم الإبداعية.

  • محتوى أكثر تخصيصًا: تتيح ميزة Flash في Gemini 2.0 للمستخدمين إنشاء قصص فيديو مخصّصة للغاية. تتيح الشخصيات المخصّصة، إلى جانب السرد الديناميكي باستخدام الذكاء الاصطناعي، سرد قصص فريدة تعزّز الرابط بين صنّاع المحتوى وجمهورهم.

  • فرص إبداعية موسّعة: من خلال الجمع بين الشخصيات الافتراضية والسرد المستنِد إلى الذكاء الاصطناعي، يمكن توسيع الإمكانات الإبداعية للفيديوهات القصيرة على Viggle. يمكن للمستخدمين استكشاف أشكال جديدة لسرد القصص، وتجاوز تنسيقات الفيديو التقليدية.

العمل للمستقبل

يسرّ فريق Viggle استكشاف إمكانات Gemini 2.0 ونماذج إنشاء الصور لتحسين منصته، كما يتوقّع مستقبلًا يتم فيه دمج الذكاء الاصطناعي بسلاسة في كل خطوة من عملية الإنشاء، ما يتيح لأي مستخدم إنشاء فيديوهات.

"في Viggle، كل شخص هو صانع محتوى. نحن بصدد إنشاء ميمز واستكشاف تقنية التقاط الحركة لمشاريع المستوى التالي وإنشاء واقع متعدّد خاص بنا. من خلال إمكانات السرد الصوتي الواقعي في Gemini 2.0 Flash، نعتقد أنّ المستخدمين سيستفيدون من إمكانات جديدة، ما سيتيح لهم إنشاء قصص بطريقة لم يسبق لها مثيل".

— "هانغ تشو"، مؤسس Viggle

يُظهر عمل Viggle مع Gemini 2.0 Flash وImagen 3 إمكانات الذكاء الاصطناعي في تحويل إنشاء الفيديوهات ومنح المستخدمين أدوات جديدة للتعبير عن أنفسهم. يشكّل هذا التعاون خطوة نحو مستقبل سرد القصص المستنِد إلى الذكاء الاصطناعي. للتعرّف على مزيد من المعلومات عن إنشاء التطبيقات باستخدام Gemini، يُرجى الانتقال إلى مستندات Gemini API والاطّلاع على مزيد من المعلومات عن Imagen 3 لمعرفة أحدث التطورات في إنشاء الصور.