Partager

11 décembre 2024

Repenser la création vidéo avec Gemini 2.0 Flash

Vishal Dharmadhikari

Ingénieur en solutions produit

Hang Chu

Viggle

Hero de la vitrine Viggle

L'API Gemini ne fait pas que renforcer les applications. Elle révolutionne l'expression créative. Viggle, la sensation virale de la vidéo avec IA qui permet à tous de transformer des photos en animations captivantes, est à la pointe de cette révolution. En testant la magie multimodale de Gemini 2.0 Flash, actuellement disponible en version preview expérimentale uniquement (et plus particulièrement ses fonctionnalités avancées de compréhension vidéo et de sortie audio, ainsi que la génération d'images par Imagen 3), Viggle développe des fonctionnalités qui permettront aux utilisateurs de donner vie à leurs idées les plus folles, de manière inédite.

Inside Viggle: la création de vidéos optimisée par l'IA avec Gemini 2.0 Flash et Imagen 3

Viggle a déjà captivé des millions d'utilisateurs grâce à sa capacité à transformer facilement des images statiques en vidéos animées avec des mouvements du corps entier, ce qui a généré des contenus viraux sur les plates-formes de réseaux sociaux. S'appuyant sur des contenus de danse et de mèmes, Viggle propose des applications mobiles (iOS et Android) et une plate-forme Web (viggle.ai). Les fonctionnalités telles que le changement de visage, l'animation d'images avec des pas de danse et l'insertion d'utilisateurs dans des scènes de films sont déjà populaires auprès de la base d'utilisateurs de Viggle. L'entreprise explore désormais de nouvelles façons de faire passer la créativité au niveau supérieur.

Viggle est actuellement en train de prototyper deux fonctionnalités qui exploitent la puissance de Gemini 2.0 Flash et d'Imagen 3:


  • Personnages vidéo virtuels à partir d'images:Viggle utilise Imagen 3 pour la génération d'images afin de créer un outil de création de personnages optimisé par l'IA. Les utilisateurs peuvent fournir des requêtes textuelles simples (par exemple, "un robot dansant avec des yeux brillants" ou "un dragon duveteux aux couleurs de l'arc-en-ciel"). Le modèle créera alors des personnages virtuels uniques prêts à jouer dans leurs vidéos. Ces personnages sont ensuite intégrés de manière transparente au moteur d'animation de Viggle, ce qui ouvre un univers de possibilités de narration personnalisées. Imaginez réaliser votre propre court-métrage d'animation mettant en scène des personnages entièrement issus de votre imagination. C'est le pouvoir que Viggle et Imagen 3 vous mettent entre les mains.

  • Voix off dynamique générée par IA:Viggle exploite également la capacité de Gemini 2.0 Flash à générer de la parole et sa compréhension approfondie des vidéos pour développer une fonctionnalité qui ajoute des voix off riches en contexte à n'importe quelle vidéo. Il ne s'agit pas simplement d'une voix monotone lisant un script. Il s'agit d'un conteur basé sur l'IA qui analyse le contenu de la vidéo (en identifiant les moments clés, les actions et même les émotions) pour générer une narration qui complète parfaitement les visuels. Qu'il s'agisse d'un commentaire humoristique sur une vidéo de danse ou d'une description épique d'une scène de fantasy, le narrateur IA ajoute une toute nouvelle dimension d'engagement.

Atteindre de nouveaux niveaux de créativité et d'engagement

L'intégration de l'IA générative devrait améliorer l'expérience Viggle de plusieurs manières essentielles:


  • Création de personnages simplifiée:la génération d'images d'Imagen 3 simplifie le processus de création et de personnalisation de personnages vidéo. Les utilisateurs peuvent désormais générer des personnages uniques en fonction de leurs idées, sans avoir besoin de compétences de conception avancées ni de s'appuyer sur des options prédéfinies limitées. Ce workflow simplifié permet à davantage d'utilisateurs de donner vie à leurs idées créatives.

  • Contenus plus personnalisés:Gemini 2.0 Flash permet aux utilisateurs de créer des récits vidéo hautement personnalisés. Les personnages personnalisés, combinés à une narration dynamique par IA, permettent de créer des histoires uniques qui renforcent les liens entre les créateurs et leur audience.

  • Possibilités créatives accrues : la combinaison de personnages virtuels et de narration optimisée par l'IA élargit le potentiel créatif des vidéos courtes sur Viggle. Les utilisateurs peuvent explorer de nouvelles formes de narration, au-delà des formats vidéo traditionnels.

Perspectives d'avenir

Viggle est ravi d'explorer davantage le potentiel de Gemini 2.0 et des modèles de génération d'images pour améliorer sa plate-forme. L'entreprise entrevoit un avenir où l'IA s'intégrera parfaitement à chaque étape du processus créatif, permettant à tous de devenir créateurs de vidéos.

"Chez Viggle, tout le monde est créateur. Nous créons des mèmes, explorons la capture de mouvement pour des projets de pointe et construisons notre propre multivers. Grâce aux fonctionnalités de narration vocale réalistes de Gemini 2.0 Flash, nous pensons que nos utilisateurs pourront exploiter de nouveaux potentiels et créer des histoires comme jamais auparavant."

— Hang Chu, fondateur de Viggle

Le travail de Viggle avec Gemini 2.0 Flash et Imagen 3 démontre le potentiel de l'IA pour transformer la création vidéo et offrir aux utilisateurs de nouveaux outils d'expression. Cette collaboration marque une étape vers l'avenir du storytelling optimisé par l'IA. Pour en savoir plus sur la création avec Gemini, consultez la documentation de l'API Gemini et découvrez Imagen 3, nos dernières avancées en matière de génération d'images.