Teilen

16. Mai 2025

Cartwheel verbessert die Charakteranimation mit der Gemini API

Jonathan Jarvis

Mitgründer und CTO

Andrew Carr

Mitbegründer und Chief Scientist

Vishal Dharmadhikari

AI DevRel

Hero-Image für Cartwheel

Cartwheel verbessert die Charakteranimation mit der Gemini API

Cartwheel ist eine Plattform für Animationen der nächsten Generation, auf der Eingaben in natürlicher Sprache (z.B. „Springen“, „Salsa-Tanzdrehung“) direkte Zeichenaktionen. Diese Innovation verbessert die Art und Weise, wie Creator Animationen für Videos, Spiele, Werbung und soziale Medien erstellen. Cartwheel nutzt Imagen 3 für ein intuitives Design von Text zu Charakteren und Gemini 2.5 Pro (Vorabversion) für die Entwicklung ausgefeilter animationsspezifischer Algorithmen, die Analyse komplexer Codebases und die Beschleunigung der Plattformoptimierung. So können Nutzer ihre kreativen Geschichten noch besser erzählen.

Herausforderungen in Forschung und Entwicklung bei generativer 3D‑Bewegung

Für die Entwicklung einer hochmodernen Animationsplattform sind nicht nur benutzerfreundliche Designtools, sondern auch kontinuierliche Innovationen bei Backend-Algorithmen und ein effizientes Codebase-Management erforderlich. Cartwheel stand vor der Herausforderung, komplexe Animationsfunktionen schnell zu prototypisieren und zu implementieren, den umfangreichen Code für die Leistung zu optimieren und Entwicklern zu ermöglichen, ein groß angelegtes System schnell zu verstehen und dazu beizutragen. Sie benötigten einen leistungsstarken KI-Partner, um ihre Entwicklungsbemühungen zu optimieren.

So nutzt Cartwheel Imagen 3 und Gemini 2.5 Pro (Vorabversion)

Cartwheel nutzt die Gemini API, um die nutzerorientierte Erstellungspipeline zu verbessern und die internen Entwicklungsprozesse zu unterstützen.

  • KI-basierte Charakterkonzeption mit Imagen 3:Cartwheel nutzt die Text-zu-Bild-Funktionen von Imagen 3. So können Creator mit Text-Prompts einzigartige Charakterbilder direkt auf der Plattform konzipieren und generieren. Diese benutzerdefinierten Charaktere können mithilfe von natürlicher Sprache animiert und dann vollständig geriggt und bereit für branchenübliche 3D-Bearbeitungssoftware wie Maya oder Blender exportiert werden. So können sie in professionelle Produktionsumgebungen eingebunden werden.
  • Unterstützung von Forschung und Entwicklung sowie Optimierung mit Gemini 2.5 Pro (Vorabversion):Das Cartwheel-Team nutzt Gemini 2.5 Pro (Vorabversion) intern, um seine Engineering- und Forschungsabläufe zu unterstützen:
    • Entwicklung von Algorithmen:Gemini 2.5 Pro (Vorabversion) wird verwendet, um animationsspezifische Funktionen zu entwickeln, darunter Algorithmen für Bewegungsunschärfe für die Datensynthese, Laplacian-Pyramiden für das Blending und Auto IK (Inverse Kinematics) für das Posing im Editor.
    • Code-Exploration und ‑Debugging:Das Team verwendet Gemini 2.5 Pro Preview, um komplexe Codebases zu untersuchen, Ideen für neue Tests zu generieren und Edge-Cases wie komplizierte Fehler bei der Kameradrehung effizient zu debuggen.
    • Langformat für Codebasisvorgänge nutzen:Die Langformatfunktionen von Gemini 2.5 Pro (Vorabversion) werden für die gesamte Codebasis von Cartwheel verwendet. So können Entwickler beispielsweise neue Codebases (z. B. das Frontend) in den Kontext einbeziehen, um Funktionen hinzuzufügen oder allgemeine Fragen zur Architektur und Funktionalität des Systems zu stellen.

Animationen erstellen

Durch den Einsatz von Gemini 2.5 Pro Preview zur Unterstützung bei der Algorithmusentwicklung, der Codeanalyse und dem Debugging möchte Cartwheel seine Entwicklungsprozesse optimieren und die Plattformoptimierung beschleunigen. Durch die Integration von Imagen 3 können Nutzer auf einfache Weise Charakterbilder aus Text generieren. Gemini 2.5 Pro Preview dient als Tool für die Entwickler, die die zugrunde liegende Technologie entwickeln. Diese Integrationen unterstützen die Ziele von Cartwheel, Animations-Workflows schneller und zugänglicher zu machen, und ermöglichen unter anderem folgende Anwendungsfälle:

  • Die Asset-Erstellung für Spiele und Videos wird beschleunigt, sodass sich Teams auf das Kerndesign konzentrieren können.
  • Effiziente Erstellung von Marketing- und Social-Media-Inhalten ermöglichen.

„Animation ist eine der reinsten Möglichkeiten, eine Geschichte aus dem Kopf zu holen und sie der Welt zu zeigen. Wir entwickeln Tools, um das für alle einfacher und zugänglicher zu machen.“

– Jonathan Jarvis, CEO / Mitbegründer, Cartwheel

Die Zukunft der Animation gestalten

Die Integration von Imagen 3 und Gemini 2.5 Pro (Vorabversion) in Cartwheel zeigt, wie Google AI eingesetzt werden kann, um neue nutzerorientierte Funktionen zu ermöglichen und die komplexe Entwicklungsarbeit zu unterstützen, die für die Entwicklung von Tools der nächsten Generation erforderlich ist.

Dokumentation zur Gemini API, Informationen zu Imagen 3 und Google AI Studio

Cartwheel nimmt am AI Futures Fund von Google teil, der in ambitionierte Start-ups investiert und mit ihnen zusammenarbeitet, um die Zukunft der KI zu gestalten.