16 mai 2025
Cartwheel fait progresser l'animation de personnages grâce à l'API Gemini

Cartwheel fait progresser l'animation de personnages grâce à l'API Gemini
Cartwheel est à la pointe de l'animation nouvelle génération. Cette plate-forme permet de générer des animations à partir de saisies en langage naturel (par exemple, "sauter", "tour de salsa") qui sont des actions directes du personnage. Cette innovation améliore la façon dont les créateurs animent leurs contenus pour les vidéos, les jeux, la publicité et les réseaux sociaux. Cartwheel intègre Imagen 3 pour une conception intuitive de texte en personnage et exploite Gemini 2.5 Pro Preview pour développer des algorithmes sophistiqués spécifiques à l'animation, explorer des bases de code complexes et accélérer l'optimisation de la plate-forme, permettant aux utilisateurs de développer leur narration créative.
Surmonter les obstacles de la R&D dans l'animation 3D générative
Pour développer une plate-forme d'animation de pointe, il faut non seulement des outils de conception conviviaux, mais aussi une innovation continue dans les algorithmes de backend et une gestion efficace de la base de code. Cartwheel devait relever le défi de prototyper et d'implémenter rapidement des fonctionnalités d'animation complexes, d'optimiser son vaste code pour les performances et de permettre aux développeurs de comprendre rapidement un système à grande échelle et d'y contribuer. Pour booster leurs efforts de développement, ils avaient besoin d'un partenaire d'IA puissant.
Comment Cartwheel utilise la preview d'Imagen 3 et de Gemini 2.5 Pro
Cartwheel utilise l'API Gemini pour améliorer son pipeline de création destiné aux utilisateurs et pour faciliter ses processus de développement internes.
- Conception de personnages basée sur l'IA avec Imagen 3 : Cartwheel intègre les fonctionnalités de texte-vers-image d'Imagen 3, ce qui permet aux créateurs d'utiliser des requêtes textuelles pour concevoir et générer des visuels de personnages uniques directement sur la plate-forme. Ces personnages personnalisés peuvent être animés en langage naturel, puis exportés entièrement truqués et prêts à être utilisés dans des logiciels de montage 3D standards tels que Maya ou Blender, ce qui permet de les intégrer dans des environnements de production professionnels.
-
Aider la R&D et l'optimisation avec la version Preview de Gemini 2.5 Pro : l'équipe Cartwheel utilise la version Preview de Gemini 2.5 Pro en interne pour ses workflows d'ingénierie et de recherche :
- Développement d'algorithmes : Gemini 2.5 Pro (version Preview) est utilisé pour développer des fonctionnalités spécifiques à l'animation, y compris des algorithmes pour le flou de mouvement pour la synthèse de données, des pyramides laplaciennes pour le mélange et l'IK automatique (cinématique inverse) pour la pose dans l'éditeur.
- Exploration et débogage du code : l'équipe utilise l'aperçu de Gemini 2.5 Pro pour explorer des bases de code complexes, générer des idées pour de nouveaux tests et déboguer efficacement les cas extrêmes, comme les erreurs complexes de rotation de la caméra.
- Exploitation du contexte long pour les opérations sur le codebase : les capacités de contexte long de Gemini 2.5 Pro (version preview) sont utilisées pour opérer sur l'ensemble du codebase de Cartwheel. Les développeurs peuvent ainsi, par exemple, contextualiser de nouvelles bases de code (comme le front-end) pour ajouter des fonctionnalités ou poser des questions générales sur l'architecture et les fonctionnalités du système.
Améliorer les workflows d'animation
En utilisant l'aperçu de Gemini 2.5 Pro pour l'aider à développer des algorithmes, à explorer le code et à déboguer, Cartwheel vise à améliorer ses processus de développement et à accélérer l'optimisation de sa plate-forme. L'intégration d'Imagen 3 permet aux utilisateurs de générer facilement des visuels de personnages à partir de texte, tandis que la version Preview de Gemini 2.5 Pro sert d'outil pour aider les développeurs à créer la technologie sous-jacente. Ces intégrations permettent à Cartwheel d'atteindre ses objectifs, à savoir rendre les workflows d'animation plus rapides et plus accessibles, en permettant des utilisations telles que :
- Accélérez la création de composants pour les jeux et les vidéos, et permettez à vos équipes de se concentrer sur la conception de base.
- Faciliter la génération efficace de contenus marketing et pour les réseaux sociaux.
"L'animation est l'un des moyens les plus purs de sortir une histoire de votre tête et de la montrer au monde. Nous développons des outils pour rendre cela plus facile et plus accessible à tous !"
Construire l'avenir de l'animation
L'intégration d'Imagen 3 et de Gemini 2.5 Pro Preview dans Cartwheel montre comment l'IA de Google peut être appliquée pour permettre de nouvelles fonctionnalités destinées aux utilisateurs et aider au travail de développement complexe nécessaire à la création d'outils de nouvelle génération.
Explorez la documentation de l'API Gemini, découvrez Imagen 3 et commencez à utiliser Google AI Studio.
Cartwheel participe au fonds Google AI Futures, qui investit dans des start-up ambitieuses et collabore avec elles pour développer l'avenir de l'IA.