16 мая 2025 г.
Cartwheel совершенствует анимацию персонажей с помощью API Gemini

Cartwheel совершенствует анимацию персонажей с помощью API Gemini
Cartwheel занимает лидирующие позиции в области анимации нового поколения, предлагая платформу, где действия персонажей управляются с помощью естественного языка (например, «прыгнуть», «сальса-кружиться»). Это нововведение улучшает анимацию для видео, игр, рекламы и социальных сетей. Cartwheel интегрирует Imagen 3 для интуитивного преобразования текста в персонажа и использует Gemini 2.5 Pro Preview для разработки сложных алгоритмов анимации, исследования сложных кодовых баз и ускорения оптимизации платформы, предоставляя пользователям возможность расширить свои творческие возможности повествования.
Преодоление препятствий в исследованиях и разработках в области генеративного 3D-движения
Разработка передовой платформы для анимации требует не только удобных инструментов проектирования, но и постоянного совершенствования бэкэнд-алгоритмов и эффективного управления кодовой базой. Перед Cartwheel стояла задача быстрого создания прототипов и внедрения сложных анимационных функций, оптимизации обширной кодовой базы для повышения производительности и предоставления разработчикам возможности быстро разобраться в крупномасштабной системе и внести в неё свой вклад. Им требовался мощный ИИ-партнёр, который бы форсировал процесс разработки.
Как Cartwheel использует Imagen 3 и Gemini 2.5 Pro Preview
Cartwheel использует API Gemini для улучшения своего пользовательского конвейера создания и упрощения внутренних процессов разработки.
- Концепция персонажей на основе искусственного интеллекта с помощью Imagen 3: Cartwheel интегрирует возможности Imagen 3 по преобразованию текста в изображение, позволяя создателям использовать текстовые подсказки для концептуализации и создания уникальных визуальных образов персонажей непосредственно на платформе. Эти индивидуально разработанные персонажи можно анимировать с помощью естественного языка, а затем экспортировать полностью готовыми к использованию в стандартных программах для 3D-редактирования, таких как Maya или Blender, что обеспечивает интеграцию в профессиональные производственные среды.
- Помощь в НИОКР и оптимизации с помощью Gemini 2.5 Pro Preview: команда Cartwheel использует Gemini 2.5 Pro Preview для внутренних целей, чтобы поддерживать свои инженерные и исследовательские рабочие процессы:
- Разработка алгоритмов: Gemini 2.5 Pro Preview используется для разработки функций, специфичных для анимации, включая алгоритмы размытия движения для синтеза данных, пирамиды Лапласа для смешивания и автоматическую IK (обратную кинематику) для позирования в редакторе.
- Исследование и отладка кода: команда использует Gemini 2.5 Pro Preview для исследования сложных кодовых баз, генерации идей для новых экспериментов и содействия эффективной отладке пограничных случаев, таких как сложные ошибки поворота камеры.
- Использование длинного контекста для работы с кодовой базой: возможности длинного контекста Gemini 2.5 Pro Preview используются для работы со всей кодовой базой Cartwheel. Это позволяет разработчикам, например, добавлять новые кодовые базы (например, интерфейс) в контекст для добавления функций или задавать общие вопросы об архитектуре и функциональности системы.
Расширение рабочих процессов анимации
Используя Gemini 2.5 Pro Preview для разработки алгоритмов, исследования кода и отладки, Cartwheel стремится улучшить процессы разработки и ускорить оптимизацию платформы. Интеграция с Imagen 3 предоставляет пользователям удобный способ создания визуальных образов персонажей из текста, а Gemini 2.5 Pro Preview служит инструментом, помогающим разработчикам создавать базовые технологии. Эти интеграции способствуют достижению целей Cartwheel по ускорению и повышению доступности анимационных процессов, позволяя использовать их в таких областях, как:
- Ускорение создания ресурсов для игр и видео, позволяющее командам сосредоточиться на основном дизайне.
- Содействие эффективному маркетингу и созданию контента в социальных сетях.
«Анимация — один из самых простых способов воплотить историю в жизнь и показать её миру. Мы создаём инструменты, которые сделают это проще и доступнее для всех!»
Создаем будущее анимации
Интеграция Imagen 3 и Gemini 2.5 Pro Preview компанией Cartwheel наглядно демонстрирует, как искусственный интеллект Google может применяться для реализации новых пользовательских функций и содействия сложной разработке, необходимой для создания инструментов следующего поколения.
Изучите документацию API Gemini , узнайте больше об Imagen 3 и начните работу в Google AI Studio .
Cartwheel является участником фонда AI Futures Fund компании Google , который инвестирует в амбициозные стартапы, разрабатывающие будущие разработки в области искусственного интеллекта, и сотрудничает с ними.
Оптимальный ИИ
Optimal AI использует API Gemini для сокращения времени проверки кода на 50%