إعادة ابتكار عملية إنشاء الفيديوهات باستخدام نموذج 2.0 Flash من Gemini
فيشال دارماديكاري
مهندس حلول المنتجات
هانغ تشو
Viggle
لا يقتصر دور Gemini API على تحسين التطبيقات، بل تشكّل ثورة في التعبير الإبداعي. يتصدّر Viggle هذه الثورة، وهي تطبيق رائج لإنشاء فيديوهات باستخدام الذكاء الاصطناعي يتيح لأي شخص تحويل الصور إلى رسوم متحركة جذابة. من خلال تجربة سحر الوسائط المتعددة في نموذج 2.0 Flash من Gemini المتوفّر حاليًا في معاينة تجريبية فقط، وتحديدًا ميزة فهم الفيديو المتقدّمة وإخراج الصوت إلى جانب إنشاء الصور باستخدام Imagen 3، يعمل Viggle على إنشاء ميزات تتيح للمستخدمين تحويل أفكارهم الأكثر جرأة إلى واقع بسهولة وبطرق لم تكن ممكنة من قبل.
Viggle: تعزيز إنشاء الفيديوهات بالذكاء الاصطناعي باستخدام 2.0 Flash وImagen 3 من Gemini
لقد اجتذب تطبيق Viggle ملايين المستخدمين بقدرته على تحويل الصور الثابتة بسهولة إلى فيديوهات متحركة مع حركة الجسم الكامل، ما أدى إلى انتشار المحتوى بشكل كبير على منصات التواصل الاجتماعي. يركّز تطبيق Viggle على الميمز ومحتوى الرقص، ويتوفّر كتطبيقات للأجهزة الجوّالة (iOS وAndroid) ومنصة على الويب (viggle.ai). تلقى ميزات مثل تبديل الوجوه وتحريك الصور باستخدام حركات الرقص وإدراج المستخدمين في مشاهد الأفلام رواجًا كبيرًا بين مستخدمي Viggle، وهم يستكشفون الآن طرقًا جديدة للارتقاء بمستوى الإبداع.
تختبر شركة Viggle حاليًا ميزتَين تستفيدان من إمكانات 2.0 Flash من Gemini وImagen 3:
تحويل الصور إلى شخصيات فيديو افتراضية: تستخدم منصة Viggle Imagen 3 لإنشاء الصور بهدف إنشاء مصنع شخصيات يستند إلى الذكاء الاصطناعي. يمكن للمستخدمين تقديم طلبات نصية بسيطة، مثل "روبوت يرقص وعيناه تلمعان" أو "تنين رقيق بألوان قوس قزح"، وسينشئ النموذج شخصيات افتراضية فريدة جاهزة للظهور في فيديوهاتهم. يتم بعد ذلك دمج هذه الشخصيات بسلاسة في محرك الرسوم المتحركة الخاص بـ Viggle، ما يفتح عالمًا من إمكانيات السرد القصصي المخصّص. تخيَّل إخراج فيلم قصير من الرسوم المتحركة من بطولة شخصيات من وحي خيالك بالكامل، هذه هي الإمكانات التي يتيحها لك Viggle وImagen 3.
التعليق الصوتي الديناميكي من إنشاء الذكاء الاصطناعي: يستفيد Viggle أيضًا من قدرة نموذج 2.0 Flash من Gemini على إنشاء الكلام وفهم الفيديوهات بشكل معمّق، وذلك لتطوير ميزة تضيف تعليقات صوتية غنية بالسياق إلى أي فيديو. هذا ليس مجرد صوت رتيب يقرأ نصًا، بل هو راوٍ من إنشاء الذكاء الاصطناعي يحلّل محتوى الفيديو، ويحدّد اللحظات الرئيسية والإجراءات وحتى المشاعر، لإنشاء سرد يكمّل المرئيات بشكل مثالي. سواء كان تعليقًا فكاهيًا على فيديو رقص أو وصفًا ملحميًا لمشهد خيالي، يضيف الراوي الذي يعمل بالذكاء الاصطناعي بُعدًا جديدًا تمامًا إلى التفاعل.
فتح آفاق جديدة للإبداع والتفاعل
من المتوقّع أن يؤدي دمج الذكاء الاصطناعي التوليدي إلى تحسين تجربة Viggle بعدة طرق رئيسية:
إنشاء شخصيات مبسط: تعمل ميزة إنشاء الصور في Imagen 3 على تبسيط عملية إنشاء شخصيات الفيديو وتخصيصها. يمكن للمستخدمين الآن إنشاء أحرف فريدة استنادًا إلى أفكارهم، ما يغنيهم عن الحاجة إلى مهارات تصميم متقدّمة أو الاعتماد على خيارات محدودة مُعدّة مسبقًا. يساعد سير العمل المبسّط هذا المزيد من المستخدمين على تنفيذ أفكارهم الإبداعية.
محتوى أكثر تخصيصًا: يتيح نموذج 2.0 Flash من Gemini للمستخدمين إنشاء روايات فيديو مخصّصة بشكل كبير. تتيح الشخصيات المصمّمة خصيصًا، بالإضافة إلى السرد الديناميكي من خلال الذكاء الاصطناعي، سرد قصص فريدة تعزّز العلاقة بين صنّاع المحتوى وجمهورهم.
إمكانات إبداعية موسّعة: يوسّع الجمع بين الشخصيات الافتراضية والتعليق الصوتي من إنشاء الذكاء الاصطناعي الإمكانات الإبداعية للفيديوهات القصيرة على Viggle. يمكن للمستخدمين استكشاف أشكال جديدة لسرد القصص، ما يتيح لهم تقديم محتوى مختلف عن تنسيقات الفيديوهات التقليدية.
العمل للمستقبل
تتطلّع Viggle إلى استكشاف إمكانات Gemini 2.0 ونماذج إنشاء الصور بشكل أكبر لتحسين منصتها، وتتوقّع مستقبلًا يتكامل فيه الذكاء الاصطناعي بسلاسة في كل خطوة من خطوات العملية الإبداعية، ما يتيح لأي شخص أن يصبح صانع فيديوهات.
"في Viggle، الجميع صنّاع محتوى. نصنع الميمات، ونستكشف إمكانية استخدام تكنولوجيا التقاط الحركة في مشاريعنا القادمة، ونعمل على بناء عالمنا المتعدد الخاص. من خلال إمكانات السرد الصوتي الواقعية في نموذج 2.0 Flash من Gemini، نعتقد أنّ المستخدمين سيستفيدون من إمكانات جديدة لصناعة القصص بشكل غير مسبوق".
— "هانغ تشو"، مؤسِّس Viggle
يؤدي استخدام Viggle مع 2.0 Flash من Gemini وImagen 3 إلى إظهار إمكانات الذكاء الاصطناعي في تغيير طريقة صناعة الفيديوهات وتزويد المستخدمين بأدوات جديدة للتعبير عن أنفسهم. يمثّل هذا التعاون خطوة نحو مستقبل سرد القصص المستند إلى الذكاء الاصطناعي. لمزيد من المعلومات حول إمكانات Gemini، يمكنك الاطّلاع على مستندات Gemini API وقراءة المزيد حول Imagen 3 للتعرّف على أحدث إنجازاتنا في مجال إنشاء الصور.
[[["يسهُل فهم المحتوى.","easyToUnderstand","thumb-up"],["ساعَدني المحتوى في حلّ مشكلتي.","solvedMyProblem","thumb-up"],["غير ذلك","otherUp","thumb-up"]],[["لا يحتوي على المعلومات التي أحتاج إليها.","missingTheInformationINeed","thumb-down"],["الخطوات معقدة للغاية / كثيرة جدًا.","tooComplicatedTooManySteps","thumb-down"],["المحتوى قديم.","outOfDate","thumb-down"],["ثمة مشكلة في الترجمة.","translationIssue","thumb-down"],["مشكلة في العيّنات / التعليمات البرمجية","samplesCodeIssue","thumb-down"],["غير ذلك","otherDown","thumb-down"]],[],[],[],null,["[](/showcase) \nShare\nDEC 11, 2024 \n\nReimagining Video Creation with Gemini 2.0 Flash \nVishal Dharmadhikari\n\nProduct Solutions Engineer \nHang Chu\n\nViggle \n\nThe Gemini API is not just enhancing apps; it's sparking a revolution in creative expression. [Viggle](https://viggle.ai/), the viral AI video sensation that lets anyone turn photos into captivating animations, is at the forefront of this revolution. By experimenting with the multimodal magic of [Gemini 2.0 Flash](http://ai.google.dev/gemini-api/docs/models/gemini#gemini-2.0-flash) available currently in experimental preview only -- specifically its advanced video understanding and audio output capability alongside image generation by [Imagen 3](https://deepmind.google/technologies/imagen-3/) -- Viggle is building features that will empower users to effortlessly bring their wildest imaginings to life, in ways never before possible.\n\nInside Viggle: Powering AI Video Creation with Gemini 2.0 Flash and Imagen 3 \nViggle has already captivated millions of users with its ability to easily transform static pictures into animated videos with full-body movement, sparking viral content across social media platforms. With a focus on memes and dance content, Viggle offers mobile apps (iOS and Android) and a web platform (viggle.ai). Features like face-swapping, animating pictures with dance moves, and inserting users into movie scenes are already popular with Viggle's user base, and now they're exploring new ways to take creativity to the next level.\n\nViggle is now prototyping two features leveraging the power of Gemini 2.0 Flash and Imagen 3:\n\n- **Image-to-Virtual Video Characters:** Viggle is using Imagen 3 for image generation to create an AI-powered character forge. Users can provide simple text prompts -- \"a dancing robot with glowing eyes\" or \"a fluffy, rainbow-colored dragon\" -- and the model will conjure up unique virtual characters ready to star in their videos. These characters are then seamlessly integrated into Viggle's animation engine, opening up a universe of personalized storytelling possibilities. Imagine directing your own animated short film starring characters born entirely from your imagination -- that's the power Viggle and Imagen 3 are putting in your hands.\n\n- **Dynamic AI Narration:** Viggle is also tapping into Gemini 2.0 Flash's ability to generate speech and its deep video understanding, to develop a feature that adds contextually rich voiceovers to any video. This isn't just a monotone voice reading a script; it's an AI storyteller that analyzes the video's content -- identifying key moments, actions, and even emotions -- to generate narration that perfectly complements the visuals. Whether it's a humorous commentary on a dance video or an epic description of a fantasy scene, the AI narrator adds a whole new dimension of engagement.\n\nUnlocking New Levels of Creativity and Engagement \n\nThe integration of generative AI is poised to enhance the Viggle experience in several key ways:\n\n- **Simplified Character Creation:** Imagen 3's image generation streamlines the process of creating and customizing video characters. Users can now generate unique characters based on their ideas, removing the need for advanced design skills or reliance on limited pre-set options. This simplified workflow empowers more users to bring their creative visions to life.\n\n- **More Personalized Content:** Gemini 2.0 Flash enables users to craft highly personalized video narratives. Custom-designed characters, combined with dynamic AI narration, allow for unique storytelling that strengthens the connection between creators and their audience.\n\n- **Expanded Creative Possibilities:** The combination of virtual characters and AI narration expands the creative potential of short-form video on Viggle. Users can explore new forms of storytelling, pushing beyond traditional video formats.\n\nLooking Ahead \n\nViggle is excited to further explore the potential of Gemini 2.0 and image gen models to improve its platform and envisions a future where AI seamlessly integrates into every step of the creative process, empowering anyone to become a video creator.\n\u003e \"At Viggle, everyone's a creator. We're making memes, exploring motion capture for next-level projects, and building our own multiverse. With Gemini 2.0 Flash's lifelike voice narration capabilities, we believe our users will unlock new potential---crafting storytelling like never before.\"\n\n--- Hang Chu, Founder of Viggle\nViggle's work with Gemini 2.0 Flash and Imagen 3 demonstrates the potential of AI to transform video creation and empower users with new tools for self-expression. This collaboration marks a step toward the future of AI-powered storytelling. To learn more about building with the Gemini, visit the [Gemini API documentation](http://ai.google.dev/gemini-api) and read more about [Imagen 3](https://cloud.google.com/vertex-ai/generative-ai/docs/image/overview\") for our latest advancements in image generation. \n\nRelated case studies \n[Tldraw\nPrototyping a new natural language computing experience on an infinite canvas with Gemini 2.0](/showcase/tldraw) [Toonsutra\nLeveraging contextual multilingual translation abilities of Gemini 2.0 to make comics and webtoons accessible to audiences in India across regional languages.](/showcase/toonsutra) [Rooms\nUnlocking richer avatar interactions with Gemini 2.0 text and audio capabilities](/showcase/rooms)"]]