Compartir

11 de diciembre de 2024

Reimaginamos la creación de videos con Gemini 2.0 Flash

Vishal Dharmadhikari

Ingeniero de soluciones de productos

Hang Chu

Viggle

Elemento hero de la presentación de Viggle

La API de Gemini no solo mejora las apps, sino que también desata una revolución en la expresión creativa. Viggle, la sensación viral de videos creados con IA que permite a cualquier persona convertir fotos en animaciones cautivadoras, está a la vanguardia de esta revolución. Al experimentar con la magia multimodal de Gemini 2.0 Flash, disponible actualmente solo en versión preliminar experimental, específicamente con su capacidad avanzada de comprensión de video y salida de audio junto con la generación de imágenes de Imagen 3, Viggle está creando funciones que permitirán a los usuarios dar vida sin esfuerzo a sus ideas más descabelladas, de formas nunca antes posibles.

Inside Viggle: Potenciamos la creación de videos con IA con Gemini 2.0 Flash y Imagen 3

Viggle ya cautivó a millones de usuarios con su capacidad de transformar fácilmente imágenes estáticas en videos animados con movimiento de cuerpo completo, lo que generó contenido viral en las plataformas de redes sociales. Con un enfoque en memes y contenido de baile, Viggle ofrece apps para dispositivos móviles (iOS y Android) y una plataforma web (viggle.ai). Las funciones como el intercambio de rostros, la animación de imágenes con movimientos de baile y la inserción de usuarios en escenas de películas ya son populares entre la base de usuarios de Viggle, y ahora están explorando nuevas formas de llevar la creatividad al siguiente nivel.

Actualmente, Viggle está creando prototipos de dos funciones que aprovechan el poder de Gemini 2.0 Flash y de Imagen 3:


  • Personajes de video virtuales a partir de imágenes: Viggle usa Imagen 3 para la generación de imágenes y crear una forja de personajes potenciada por IA. Los usuarios pueden proporcionar instrucciones de texto simples, como "un robot bailando con ojos brillantes" o "un dragón esponjoso de color arcoíris", y el modelo creará personajes virtuales únicos listos para protagonizar sus videos. Luego, estos personajes se integran sin problemas en el motor de animación de Viggle, lo que abre un universo de posibilidades personalizadas para contar historias. Imagina dirigir tu propio cortometraje animado protagonizado por personajes que nacieron completamente de tu imaginación. Ese es el poder que Viggle y Imagen 3 ponen en tus manos.

  • Narración dinámica con IA: Viggle también aprovecha la capacidad de Gemini 2.0 Flash para generar voz y su profunda comprensión de los videos para desarrollar una función que agrega voces en off enriquecidas contextualmente a cualquier video. No se trata solo de una voz monótona que lee un guion, sino de un narrador de IA que analiza el contenido del video (identifica momentos clave, acciones y hasta emociones) para generar una narración que complemente a la perfección los elementos visuales. Ya sea un comentario humorístico sobre un video de baile o una descripción épica de una escena de fantasía, el narrador de IA agrega una dimensión completamente nueva de participación.

Desbloquea nuevos niveles de creatividad y participación

La integración de la IA generativa mejorará la experiencia de Viggle de varias maneras clave:


  • Creación de personajes simplificada: La generación de imágenes de Imagen 3 optimiza el proceso de creación y personalización de personajes de video. Ahora los usuarios pueden generar personajes únicos basados en sus ideas, lo que elimina la necesidad de tener habilidades de diseño avanzadas o depender de opciones predeterminadas limitadas. Este flujo de trabajo simplificado permite que más usuarios hagan realidad sus visiones creativas.

  • Contenido más personalizado: Gemini 2.0 Flash permite a los usuarios crear narrativas de video altamente personalizadas. Los personajes diseñados a medida, combinados con la narración dinámica de IA, permiten contar historias únicas que fortalecen la conexión entre los creadores y su público.

  • Más posibilidades creativas: La combinación de personajes virtuales y narración con IA amplía el potencial creativo de los videos de formato corto en Viggle. Los usuarios pueden explorar nuevas formas de contar historias, más allá de los formatos de video tradicionales.

Qué trae el futuro

Viggle se complace en seguir explorando el potencial de Gemini 2.0 y los modelos de generación de imágenes para mejorar su plataforma, y prevé un futuro en el que la IA se integre sin problemas en cada paso del proceso creativo, lo que permitirá que cualquier persona se convierta en creador de videos.

"En Viggle, todos son creadores. Creamos memes, exploramos la captura de movimiento para proyectos de otro nivel y construimos nuestro propio multiverso. Con las capacidades de narración de voz realistas de Gemini 2.0 Flash, creemos que nuestros usuarios desbloquearán un nuevo potencial y crearán historias como nunca antes".

— Hang Chu, fundador de Viggle

El trabajo de Viggle con Gemini 2.0 Flash y Imagen 3 demuestra el potencial de la IA para transformar la creación de videos y brindar a los usuarios nuevas herramientas para expresarse. Esta colaboración marca un paso hacia el futuro de la narración impulsada por IA. Para obtener más información sobre cómo crear con Gemini, visita la documentación de la API de Gemini y lee más sobre Imagen 3 para conocer nuestros avances más recientes en la generación de imágenes.