Compartir

16 de mayo de 2025

Cartwheel mejora la animación de personajes con la API de Gemini

Jonathan Jarvis

Cofundador y director de tecnología

Andrew Carr

Cofundador y director científico

Vishal Dharmadhikari

Relaciones con desarrolladores de IA

Elemento hero de la presentación de Cartwheel

Cartwheel mejora la animación de personajes con la API de Gemini

Cartwheel está a la vanguardia de la animación de próxima generación y ofrece una plataforma en la que las entradas de lenguaje natural (p.ej., "saltar", "giro de baile de salsa") acciones directas del personaje. Esta innovación mejora la forma en que los creadores animan contenido para videos, videojuegos, publicidad y redes sociales. Cartwheel integra Imagen 3 para un diseño intuitivo de texto a personaje y aprovecha la versión preliminar de Gemini 2.5 Pro para desarrollar algoritmos sofisticados específicos para la animación, explorar bases de código complejas y acelerar la optimización de la plataforma, lo que permite a los usuarios expandir su narración creativa.

Cómo superar los obstáculos de I+D en el movimiento 3D generativo

Desarrollar una plataforma de animación de vanguardia requiere no solo herramientas de diseño fáciles de usar, sino también innovación continua en los algoritmos de backend y una administración eficiente de la base de código. Cartwheel se enfrentó al desafío de crear prototipos e implementar rápidamente funciones de animación complejas, optimizar su extenso código base para mejorar el rendimiento y permitir que los desarrolladores comprendan y contribuyan rápidamente a un sistema a gran escala. Necesitaban un socio de IA potente para potenciar sus esfuerzos de desarrollo.

Cómo Cartwheel usa Imagen 3 y la versión preliminar de Gemini 2.5 Pro

Cartwheel usa la API de Gemini para mejorar su canalización de creación orientada al usuario y ayudar en sus procesos de desarrollo internos.

  • Concepción de personajes impulsada por IA con Imagen 3: Cartwheel integra las capacidades de texto a imagen de Imagen 3, lo que permite a los creadores usar instrucciones de texto para conceptualizar y generar imágenes de personajes únicos directamente en la plataforma. Estos personajes diseñados a medida se pueden animar con lenguaje natural y, luego, exportar completamente equipados y listos para usar en software de edición 3D estándar de la industria, como Maya o Blender, lo que permite la integración en entornos de producción profesionales.
  • Asistencia para la I+D y la optimización con la versión preliminar de Gemini 2.5 Pro: El equipo de Cartwheel usa internamente la versión preliminar de Gemini 2.5 Pro para respaldar sus flujos de trabajo de ingeniería e investigación:
    • Desarrollo de algoritmos: La versión preliminar de Gemini 2.5 Pro se utiliza para ayudar a desarrollar funciones específicas de animación, incluidos algoritmos para el desenfoque de movimiento para la síntesis de datos, pirámides laplacianas para la combinación y la cinemática inversa automática para la pose en el editor.
    • Exploración y depuración de código: El equipo usa la versión preliminar de Gemini 2.5 Pro para explorar bases de código complejas, generar ideas para nuevos experimentos y ayudar a depurar de manera eficiente casos extremos, como errores complejos de rotación de la cámara.
    • Aprovechamiento del contexto largo para las operaciones de la base de código: Las capacidades de contexto largo de la versión preliminar de Gemini 2.5 Pro se usan para operar en toda la base de código de Cartwheel. Esto permite a los desarrolladores, por ejemplo, incorporar nuevas bases de código (como el frontend) en el contexto para ayudar a agregar funciones o hacer preguntas de alto nivel sobre la arquitectura y la funcionalidad del sistema.

Potencia los flujos de trabajo de animación

Con la versión preliminar de Gemini 2.5 Pro para ayudar con el desarrollo de algoritmos, la exploración de código y la depuración, Cartwheel busca mejorar sus procesos de desarrollo y acelerar la optimización de la plataforma. La integración de Imagen 3 proporciona a los usuarios una forma optimizada de generar imágenes de personajes a partir de texto, mientras que la versión preliminar de Gemini 2.5 Pro sirve como herramienta para ayudar a los desarrolladores a crear la tecnología subyacente. Estas integraciones respaldan los objetivos de Cartwheel de hacer que los flujos de trabajo de animación sean más rápidos y accesibles, lo que permite usos como los siguientes:

  • Acelera la creación de recursos para juegos y videos, lo que permite que los equipos se enfoquen en el diseño principal.
  • Facilitar la generación eficiente de contenido de marketing y redes sociales

"La animación es una de las formas más puras de sacar una historia de tu cabeza y mostrársela al mundo. Estamos creando herramientas para que sea más fácil y accesible para todos".

- Jonathan Jarvis, director general y cofundador de Cartwheel

Construyendo el futuro de la animación

La integración de Imagen 3 y la versión preliminar de Gemini 2.5 Pro en Cartwheel destaca cómo se puede aplicar la IA de Google para habilitar nuevas funciones orientadas al usuario y ayudar con el complejo trabajo de desarrollo necesario para crear herramientas de próxima generación.

Explora la documentación de la API de Gemini, obtén información sobre Imagen 3 y comienza a usar Google AI Studio.

Cartwheel participa en AI Futures Fund de Google, que invierte en startups ambiciosas y colabora con ellas para crear el futuro de la IA.