Udostępnij

16 maja 2025 r.

Cartwheel Advances Character Animation Using the Gemini API

Jonathan Jarvis

Współzałożyciel i dyrektor ds. technologii

Andrew Carr

Współzałożyciel i główny naukowiec

Vishal Dharmadhikari

AI DevRel

Baner powitalny Cartwheel

Cartwheel Advances Character Animation Using the Gemini API

Cartwheel to platforma do tworzenia animacji nowej generacji, która wykorzystuje dane wejściowe w języku naturalnym (np. „jump”, „salsa dance spin”) – działania postaci; Ta innowacja ułatwia twórcom animację w przypadku filmów, gier, reklam i mediów społecznościowych. Cartwheel integruje Imagen 3, aby umożliwić intuicyjne projektowanie tekstu, oraz wykorzystuje Gemini 2.5 Pro Preview do tworzenia zaawansowanych algorytmów do animacji, eksplorowania złożonych baz kodu i przyspieszania optymalizacji platformy, co pozwala użytkownikom na tworzenie bardziej kreatywnych opowieści.

Pokonanie przeszkód w badaniach i rozwoju związanych z generowaniem ruchu 3D

Tworzenie zaawansowanej platformy do tworzenia animacji wymaga nie tylko przyjaznych użytkownikowi narzędzi do projektowania, ale też ciągłego ulepszania algorytmów backendowych i skutecznego zarządzania bazą kodu. Zespół Cartwheel stanął przed wyzwaniem, jakim było szybkie tworzenie prototypów i wdrażanie złożonych funkcji animacji, optymalizowanie rozbudowanej bazy kodu pod kątem wydajności oraz umożliwienie programistom szybkiego zrozumienia i wspomagania systemu na dużą skalę. Potrzebowali silnego partnera w zakresie sztucznej inteligencji, który pomoże im przyspieszyć proces tworzenia.

Jak Cartwheel korzysta z Imagen 3 i Gemini 2.5 Pro Preview

Cartwheel używa interfejsu Gemini API do ulepszania procesu tworzenia treści dla użytkowników i do wspomagania wewnętrznych procesów rozwoju.

  • Twórz postaci za pomocą AI dzięki Imagen 3: Cartwheel integruje funkcje zamiany tekstu na obraz w Imagen 3, dzięki czemu twórcy mogą używać promptów tekstowych do tworzenia koncepcji i generowania niepowtarzalnych obrazów postaci bezpośrednio na platformie. Te niestandardowe postacie można animować za pomocą języka naturalnego, a potem wyeksportować w pełni przygotowane i gotowe do użycia w standardowym oprogramowaniu do edycji 3D, takim jak Maya czy Blender. Umożliwia to integrację z profesjonalnymi środowiskami produkcyjnymi.
  • Wspomaganie badań i rozwoju oraz optymalizacji za pomocą wersji wstępnej Gemini 2.5 Pro: zespół Cartwheel korzysta z wersji wstępnej Gemini 2.5 Pro w ramach wewnętrznych procesów inżynieryjnych i badawczych:
    • Tworzenie algorytmów: wersja próbna Gemini 2.5 Pro jest używana do tworzenia funkcji związanych z animacją, w tym algorytmów do rozmywania ruchu na potrzeby syntezy danych, piramid Laplacza do mieszania i automatycznego IK (inwersyjnej kinematyki) do pozowania w edytorze.
    • Badania i debugowanie kodu: zespół korzysta z wersji Gemini 2.5 Pro Preview, aby badać złożone bazy kodu, generować pomysły na nowe eksperymenty i pomagać w skutecznym debugowaniu trudnych przypadków, takich jak skomplikowane błędy obrotu kamery.
    • Korzystanie z długiego kontekstu w operacjach na kodzie: funkcje długiego kontekstu w Gemini 2.5 Pro Preview są używane do działania na całym kodzie źródłowym Cartwheel. Dzięki temu deweloperzy mogą na przykład dodawać nowe bazy kodu (np. front-end) w kontekście, aby ułatwić dodawanie funkcji lub zadawanie ogólnych pytań na temat architektury i funkcjonalności systemu.

Workflows – tworzenie animacji

Firma Cartwheel używa wersji wstępnie Gemini 2.5 Pro, aby ułatwić tworzenie algorytmów, analizowanie kodu i debugowanie. Dzięki temu chce usprawnić procesy programistyczne i przyspieszyć optymalizację platformy. Integracja z Imagen 3 zapewnia użytkownikom uproszczony sposób generowania wizualizacji postaci na podstawie tekstu, a Gemini 2.5 Pro Preview jest narzędziem ułatwiającym deweloperom tworzenie podstawowej technologii. Te integracje wspierają cele Cartwheel, które polegają na przyspieszeniu i ułatwieniu tworzenia animacji, umożliwiając takie działania jak:

  • przyspieszenie tworzenia komponentów do gier i filmów, dzięki czemu zespoły mogą skupić się na głównym projekcie;
  • Ułatwianie skutecznego marketingu i tworzenia treści do mediów społecznościowych.

„Animacja to jeden z najczystszych sposobów na to, aby opowiedzieć historię i pokazać ją światu. Tworzymy narzędzia, które ułatwiają i ułatwiają dostęp do wszystkich.

– Jonathan Jarvis, prezes i współzałożyciel Cartwheel

Budowanie przyszłości animacji

Integracja Cartwheel z Imagen 3 i Gemini 2.5 Pro Preview pokazuje, jak można wykorzystywać AI od Google do tworzenia nowych funkcji dla użytkowników i ułatwiania skomplikowanej pracy programistycznej wymaganej do tworzenia narzędzi nowej generacji.

Zapoznaj się z dokumentacją interfejsu Gemini API, dowiedz się więcej o Imagen 3 i rozpocznij pracę w Google AI Studio.

Firma Cartwheel jest uczestnikiem funduszu AI Futures Fund, który inwestuje w ambitne startupy i współpracuje z nimi nad rozwojem AI.