Compartir

11 de diciembre de 2024

Reimagina la creación de videos con Gemini 2.0 Flash

Vishal Dharmadhikari

Ingeniero de soluciones de productos

Hang Chu

Viggle

Hero de la presentación de Viggle

La API de Gemini no solo mejora las apps, sino que está provocando una revolución en la expresión creativa. Viggle, la sensación viral de videos de IA que permite que cualquier persona convierta fotos en animaciones cautivadoras, está a la vanguardia de esta revolución. Viggle experimenta con la magia multimodal de Gemini 2.0 Flash, que actualmente solo está disponible en versión preliminar experimental, específicamente con su capacidad avanzada de comprensión de video y salida de audio junto con la generación de imágenes de Imagen 3. Con esto, se crean funciones que permitirán a los usuarios dar vida a sus imaginaciones más descabelladas sin esfuerzo, de formas que antes no eran posibles.

Inside Viggle: potencia la creación de videos con IA con Gemini 2.0 Flash y Imagen 3

Viggle ya cautivó a millones de usuarios con su capacidad de transformar fácilmente imágenes estáticas en videos animados con movimiento de cuerpo completo, lo que generó contenido viral en las plataformas de redes sociales. Con un enfoque en los memes y el contenido de baile, Viggle ofrece apps para dispositivos móviles (iOS y Android) y una plataforma web (viggle.ai). Las funciones como el intercambio de rostros, la animación de imágenes con movimientos de baile y la inserción de usuarios en escenas de películas ya son populares entre la base de usuarios de Viggle, y ahora están explorando nuevas formas de llevar la creatividad al siguiente nivel.

Actualmente, Viggle está creando prototipos de dos funciones que aprovechan la potencia de Gemini 2.0 Flash y Imagen 3:


  • Imagen a personajes de video virtuales: Viggle usa Imagen 3 para la generación de imágenes y crear una forja de personajes potenciada por IA. Los usuarios pueden proporcionar instrucciones de texto simples, como "un robot bailando con ojos brillantes" o "un dragón esponjoso de colores del arcoíris", y el modelo creará personajes virtuales únicos listos para protagonizar sus videos. Luego, estos personajes se integran sin problemas en el motor de animación de Viggle, lo que abre un universo de posibilidades de narración personalizada. Imagina dirigir tu propio cortometraje animado con personajes nacidos de tu imaginación. Ese es el poder que Viggle y Imagen 3 ponen en tus manos.

  • Narración dinámica de IA: Viggle también aprovecha la capacidad de Gemini 2.0 Flash para generar voz y su comprensión profunda de los videos para desarrollar una función que agregue voces en off contextualmente ricas a cualquier video. No es solo una voz monótona que lee un guion, sino un narrador de IA que analiza el contenido del video, identifica momentos clave, acciones y hasta emociones para generar una narración que complementa perfectamente las imágenes. Ya sea un comentario humorístico en un video de baile o una descripción épica de una escena de fantasía, el narrador de IA agrega una nueva dimensión de participación.

Desbloquea nuevos niveles de creatividad y participación

La integración de la IA generativa está preparada para mejorar la experiencia de Viggle de varias maneras clave:


  • Creación de personajes simplificada: La generación de imágenes de Imagen 3 optimiza el proceso de creación y personalización de personajes de video. Ahora los usuarios pueden generar personajes únicos en función de sus ideas, lo que elimina la necesidad de tener habilidades de diseño avanzadas o depender de opciones predeterminadas limitadas. Este flujo de trabajo simplificado permite que más usuarios hagan realidad sus visiones creativas.

  • Contenido más personalizado: Gemini 2.0 Flash permite a los usuarios crear narrativas de video altamente personalizadas. Los personajes diseñados a medida, combinados con la narración dinámica de IA, permiten contar historias únicas que fortalecen la conexión entre los creadores y su público.

  • Posibilidades creativas expandidas: La combinación de personajes virtuales y narración de IA expande el potencial creativo de los videos de formato corto en Viggle. Los usuarios pueden explorar nuevas formas de contar historias y superar los formatos de video tradicionales.

Qué trae el futuro

En Viggle, nos entusiasma explorar aún más el potencial de Gemini 2.0 y los modelos de generación de imágenes para mejorar nuestra plataforma. Imaginamos un futuro en el que la IA se integre sin problemas en cada paso del proceso creativo, lo que permitirá que cualquier persona se convierta en creador de videos.

“En Viggle, todos son creadores. Hacemos memes, exploramos la captura de movimiento para proyectos de siguiente nivel y creamos nuestro propio multiverso. Con las capacidades de narración de voz realista de Gemini 2.0 Flash, creemos que nuestros usuarios descubrirán un nuevo potencial: crear historias como nunca antes”.

— Hang Chu, fundador de Viggle

El trabajo de Viggle con Gemini 2.0 Flash y Imagen 3 demuestra el potencial de la IA para transformar la creación de videos y empoderar a los usuarios con nuevas herramientas de autoexpresión. Esta colaboración marca un paso hacia el futuro de la narración potenciada por IA. Para obtener más información sobre la compilación con Gemini, visita la documentación de la API de Gemini y lee más sobre Imagen 3 para conocer nuestros avances más recientes en la generación de imágenes.