Делиться

16 мая 2025 г.

Cartwheel улучшает анимацию персонажей, используя API Gemini.

Джонатан Джарвис

Соучредитель и технический директор

Эндрю Карр

Соучредитель и главный научный сотрудник

Вишал Дхармадхикари

AI DevRel

Герой шоу «Колесо»

Cartwheel улучшает анимацию персонажей, используя API Gemini.

Cartwheel находится на переднем крае анимации нового поколения, предлагая платформу, где ввод с помощью естественного языка (например, «прыжок», «вращение в танце сальса») направляет действия персонажа. Это нововведение улучшает способы создания анимации для видео, игр, рекламы и социальных сетей. Cartwheel интегрирует Imagen 3 для интуитивно понятного проектирования текста и персонажей, а также использует Gemini 2.5 Pro Preview для разработки сложных алгоритмов, специфичных для анимации, исследования сложных кодовых баз и ускорения оптимизации платформы, позволяя пользователям расширить свои возможности в области творческого повествования.

Преодоление трудностей в исследованиях и разработках в области генеративного 3D-движения

Разработка передовой платформы для анимации требует не только удобных инструментов проектирования, но и постоянных инноваций в алгоритмах бэкэнда, а также эффективного управления кодовой базой. Компания Cartwheel столкнулась с проблемой быстрого прототипирования и внедрения сложных функций анимации, оптимизации своей обширной кодовой базы для повышения производительности и предоставления разработчикам возможности быстро понимать и вносить свой вклад в крупномасштабную систему. Им нужен был мощный партнер в области искусственного интеллекта, чтобы значительно ускорить процесс разработки.

Как Cartwheel использует Imagen 3 и Gemini 2.5 Pro (предварительная версия)

Cartwheel использует API Gemini для улучшения процесса создания контента, ориентированного на пользователей, а также для поддержки внутренних процессов разработки.

  • Создание персонажей с помощью ИИ и Imagen 3: Cartwheel интегрирует возможности Imagen 3 по преобразованию текста в изображение, позволяя создателям использовать текстовые подсказки для концептуализации и генерации уникальных визуальных образов персонажей непосредственно в платформе. Эти созданные на заказ персонажи могут быть анимированы с использованием естественного языка, а затем экспортированы в полностью анимированном виде и готовы к использованию в стандартных отраслевых программах 3D-редактирования, таких как Maya или Blender, что позволяет интегрировать их в профессиональные производственные среды.
  • Поддержка исследований и разработок и оптимизации с помощью Gemini 2.5 Pro Preview: Команда Cartwheel использует Gemini 2.5 Pro Preview внутри компании для поддержки своих инженерных и исследовательских рабочих процессов:
    • Разработка алгоритмов: Gemini 2.5 Pro Preview используется для разработки функций, специфичных для анимации, включая алгоритмы размытия движения для синтеза данных, лапласианские пирамиды для смешивания и автоматическую обратную кинематику (ИК) для позиционирования в редакторе.
    • Исследование и отладка кода: Команда использует Gemini 2.5 Pro Preview для исследования сложных кодовых баз, генерации идей для новых экспериментов и оказания помощи в эффективной отладке сложных случаев, таких как ошибки вращения камеры.
    • Использование расширенного контекста для работы с кодовой базой: возможности расширенного контекста в Gemini 2.5 Pro Preview используются для работы со всей кодовой базой Cartwheel. Это позволяет разработчикам, например, подключать новые кодовые базы (например, фронтенд) к контексту, чтобы добавлять новые функции или задавать вопросы высокого уровня об архитектуре и функциональности системы.

Расширение возможностей рабочих процессов анимации

Используя Gemini 2.5 Pro Preview для разработки алгоритмов, исследования кода и отладки, Cartwheel стремится улучшить свои процессы разработки и ускорить оптимизацию платформы. Интеграция Imagen 3 предоставляет пользователям упрощенный способ создания визуальных образов персонажей из текста, а Gemini 2.5 Pro Preview служит инструментом, помогающим разработчикам создавать базовую технологию. Эти интеграции поддерживают цели Cartwheel по ускорению и повышению доступности рабочих процессов анимации, позволяя использовать их, например:

  • Ускорение создания ресурсов для игр и видео, позволяющее командам сосредоточиться на основном дизайне.
  • Обеспечение эффективного маркетинга и создания контента для социальных сетей.

«Анимация — один из самых чистых способов воплотить историю в жизнь и показать её миру. Мы создаём инструменты, которые сделают этот процесс проще и доступнее для всех!»

- Джонатан Джарвис, генеральный директор/соучредитель Cartwheel

Строим будущее анимации

Интеграция Imagen 3 и Gemini 2.5 Pro Preview в Cartwheel демонстрирует, как искусственный интеллект Google может быть использован для создания новых функций, ориентированных на пользователя, и для содействия сложной работе по разработке инструментов следующего поколения.

Изучите документацию по API Gemini , узнайте об Imagen 3 и начните работу в Google AI Studio .

Cartwheel является участником фонда Google AI Futures Fund , который инвестирует в амбициозные стартапы, создающие будущее искусственного интеллекта, и сотрудничает с ними.

Оптимальный ИИ

Optimal AI использует API Gemini для сокращения времени проверки кода на 50%.