分享

2025 年 5 月 16 日

Cartwheel 運用 Gemini API 提升角色動畫品質

Jonathan Jarvis

共同創辦人兼技術長

Andrew Carr

共同創辦人兼首席科學家

Vishal Dharmadhikari

AI 開發人員關係維繫

Cartwheel 展示主打商品

Cartwheel 運用 Gemini API 提升角色動畫技術

Cartwheel 採用新一代動畫技術,提供可輸入自然語言 (例如「一隻貓在跳舞」) 的平台,「跳躍」、「莎莎舞旋轉」) 等直接角色動作。這項創新技術可提升創作者製作影片、遊戲、廣告和社群媒體動畫的效率。Cartwheel 整合 Imagen 3,提供直覺的文字轉角色設計功能,並運用 Gemini 2.5 Pro 預先發布版開發精密的動畫專用演算法、探索複雜的程式碼庫,以及加快平台最佳化作業,協助使用者拓展創意敘事能力。

克服生成式 3D 動態的研發障礙

開發尖端動畫平台不僅需要簡單易用的設計工具,還需要持續創新後端演算法,並有效管理程式碼集。Cartwheel 面臨的挑戰包括快速製作原型和導入複雜的動畫功能、針對效能最佳化龐大的程式碼集,以及讓開發人員快速瞭解並貢獻大型系統。他們需要強大的 AI 合作夥伴,協助提升開發工作效率。

Cartwheel 如何使用 Imagen 3 和 Gemini 2.5 Pro 預先發布版

Cartwheel 使用 Gemini API 改善面向使用者的創作流程,並輔助內部開發程序。

  • 透過 Imagen 3 運用 AI 構思角色:Cartwheel 整合了 Imagen 3 的文字轉圖像功能,讓創作者直接在平台中使用文字提示詞構思及生成獨特的角色圖像。這些量身打造的角色可使用自然語言製作動畫,然後匯出完整裝備,並在 Maya 或 Blender 等業界標準 3D 編輯軟體中編輯,以便整合至專業製作環境。
  • 使用 Gemini 2.5 Pro 搶先版輔助研發和最佳化:Cartwheel 團隊在內部使用 Gemini 2.5 Pro 搶先版,支援工程和研究工作流程:
    • 開發演算法:我們使用 Gemini 2.5 Pro 搶先版開發動畫專屬功能,包括資料合成的動態模糊演算法、混合的拉普拉斯金字塔,以及編輯器內擺姿勢的自動反向運動學 (IK)。
    • 程式碼探索與調試: 團隊使用 Gemini 2.5 Pro Preview 來探索複雜的程式碼庫,為新的實驗產生想法,並協助高效地調試邊緣情況,例如複雜的相機旋轉錯誤。
    • 運用長脈絡窗口進行程式碼集作業:Gemini 2.5 Pro 搶先版的長脈絡窗口功能可用於處理 Cartwheel 的整個程式碼集。舉例來說,開發人員可以將新的程式碼庫 (例如前端) 帶入情境,協助新增功能,或詢問系統架構和功能的高階問題。

增強動畫工作流程

Cartwheel 打算使用 Gemini 2.5 Pro 搶先版輔助演算法開發、程式碼探索和偵錯,藉此提升開發程序,並加快平台最佳化速度。整合 Imagen 3 後,使用者就能以簡化的方式從文字生成角色圖像,而 Gemini 2.5 Pro 搶先版則可做為工具,協助開發人員建構基礎技術。這些整合功能可協助 Cartwheel 達成目標,讓動畫工作流程更快速且更容易使用,例如:

  • 加速遊戲和影片的素材資源製作流程,讓團隊專注於核心設計。
  • 促進高效的行銷和社群媒體內容產生。

「動畫是將腦海中的故事呈現給世人的最純粹方式之一。我們正在開發相關工具,讓所有人都能輕鬆使用這項技術!」

- Cartwheel 執行長 / 共同創辦人 Jonathan Jarvis

建構動畫的未來

Cartwheel 整合 Imagen 3 和 Gemini 2.5 Pro 預先發布版,充分展現 Google AI 的應用潛力,不僅能提供全新使用者功能,還能協助開發新一代工具所需的複雜開發工作。

探索 Gemini API 文件,瞭解 Imagen 3,並開始使用 Google AI Studio

Cartwheel 是 Google AI Futures Fund 的參與者,該基金會投資並與雄心勃勃的新創公司合作,共同打造 AI 的未來。