Udostępnij

16 maja 2025 r.

Cartwheel ulepsza animację postaci za pomocą interfejsu Gemini API

Jonathan Jarvis

Współzałożyciel i dyrektor ds. technologii

Andrew Carr

Współzałożyciel i główny naukowiec

Vishal Dharmadhikari

AI DevRel

Bohater prezentacji Cartwheel

Cartwheel ulepsza animację postaci za pomocą interfejsu Gemini API

Cartwheel to platforma do tworzenia animacji nowej generacji, która umożliwia wprowadzanie danych w języku naturalnym (np. „skok”, „obrót w salsie”) bezpośrednie działania postaci. To innowacyjne rozwiązanie usprawnia tworzenie animacji do filmów, gier, reklam i mediów społecznościowych. Cartwheel integruje Imagen 3, aby umożliwić intuicyjne projektowanie postaci na podstawie tekstu, oraz wykorzystuje Gemini 2.5 Pro w wersji testowej do opracowywania zaawansowanych algorytmów związanych z animacją, eksplorowania złożonych baz kodu i przyspieszania optymalizacji platformy, co pozwala użytkownikom rozwijać kreatywne opowiadanie historii.

Pokonywanie przeszkód w badaniach i rozwoju w zakresie generatywnego ruchu 3D

Opracowanie nowoczesnej platformy do animacji wymaga nie tylko przyjaznych dla użytkownika narzędzi do projektowania, ale także ciągłych innowacji w algorytmach backendu i wydajnego zarządzania bazą kodu. Zespół Cartwheel musiał szybko tworzyć prototypy i wdrażać złożone funkcje animacji, optymalizować obszerny kod pod kątem wydajności oraz umożliwiać programistom szybkie zrozumienie systemu na dużą skalę i współtworzenie go. Potrzebowali zaawansowanego partnera AI, który usprawni ich działania w zakresie rozwoju.

Jak Cartwheel korzysta z Imagen 3 i wersji testowej Gemini 2.5 Pro

Cartwheel używa interfejsu Gemini API do ulepszania procesu tworzenia treści dla użytkowników i wspomagania wewnętrznych procesów programistycznych.

  • Tworzenie postaci za pomocą AI z Imagen 3: Cartwheel integruje funkcje zamiany tekstu na obraz Imagen 3, dzięki czemu twórcy mogą używać promptów tekstowych do tworzenia i generowania unikalnych wizualizacji postaci bezpośrednio na platformie. Te zaprojektowane przez użytkownika postacie można animować za pomocą języka naturalnego, a następnie eksportować w pełni przygotowane do użycia w standardowym oprogramowaniu do edycji 3D, takim jak Maya czy Blender, co umożliwia integrację z profesjonalnymi środowiskami produkcyjnymi.
  • Wspomaganie prac badawczo-rozwojowych i optymalizacji dzięki wersji podglądowej Gemini 2.5 Pro: zespół Cartwheel używa wewnętrznie wersji podglądowej Gemini 2.5 Pro do obsługi procesów inżynieryjnych i badawczych:
    • Opracowywanie algorytmów: wersja testowa Gemini 2.5 Pro jest używana do opracowywania funkcji specyficznych dla animacji, w tym algorytmów rozmycia ruchu na potrzeby syntezy danych, piramid laplasowskich do mieszania i automatycznej kinematyki odwrotnej (IK) do pozowania w edytorze.
    • Eksploracja i debugowanie kodu: zespół korzysta z wersji testowej Gemini 2.5 Pro, aby eksplorować złożone bazy kodu, generować pomysły na nowe eksperymenty i skutecznie debugować przypadki brzegowe, takie jak skomplikowane błędy rotacji kamery.
    • Wykorzystanie długiego okna kontekstu do operacji na bazie kodu: możliwości długiego okna kontekstu w wersji testowej Gemini 2.5 Pro są wykorzystywane do obsługi całej bazy kodu Cartwheel. Dzięki temu deweloperzy mogą na przykład wprowadzać nowe bazy kodu (takie jak frontend) w kontekście, aby ułatwić dodawanie funkcji lub zadawanie ogólnych pytań dotyczących architektury i funkcjonalności systemu.

Ulepszanie przepływów pracy związanych z animacją

Korzystając z wersji podglądowej Gemini 2.5 Pro do pomocy w opracowywaniu algorytmów, eksplorowaniu kodu i debugowaniu, Cartwheel chce ulepszyć procesy programistyczne i przyspieszyć optymalizację platformy. Integracja z Imagen 3 zapewnia użytkownikom prosty sposób generowania obrazów postaci na podstawie tekstu, a wersja testowa Gemini 2.5 Pro służy jako narzędzie wspomagające pracę deweloperów tworzących technologię bazową. Integracje te wspierają cele Cartwheel, czyli przyspieszanie i ułatwianie przepływów pracy związanych z animacją, umożliwiając takie zastosowania jak:

  • Przyspieszenie tworzenia zasobów do gier i filmów, dzięki czemu zespoły mogą skupić się na podstawowym projekcie.
  • ułatwianie sprawnego generowania treści marketingowych i treści do mediów społecznościowych;

„Animacja to jeden z najczystszych sposobów na to, by wydobyć z głowy historię i pokazać ją światu. Tworzymy narzędzia, które ułatwiają i umożliwiają to wszystkim użytkownikom”.

– Jonathan Jarvis, prezes / współzałożyciel, Cartwheel

Budowanie przyszłości animacji

Integracja Imagen 3 i Gemini 2.5 Pro w Cartwheel pokazuje, jak można wykorzystać AI od Google do tworzenia nowych funkcji dla użytkowników i wspierania złożonych prac programistycznych wymaganych do budowania narzędzi nowej generacji.

Zapoznaj się z dokumentacją interfejsu Gemini API, dowiedz się więcej o Imagen 3 i zacznij korzystać z Google AI Studio.

Cartwheel uczestniczy w programie Google AI Futures Fund, który inwestuje w ambitne startupy tworzące przyszłość AI i z nimi współpracuje.