2025 年 5 月 16 日
Cartwheel 運用 Gemini API 提升角色動畫效果

Cartwheel 運用 Gemini API 提升角色動畫技術
Cartwheel 站在新一代動畫的最前線,提供一個平台,讓使用者透過自然語言輸入 (例如「一隻貓在樹上跳舞」) 製作動畫。「跳躍」、「莎莎舞旋轉」) 直接執行角色動作。這項創新技術可提升創作者製作影片、遊戲、廣告和社群媒體動畫的效率。Cartwheel 整合 Imagen 3,提供直覺式的文字轉角色設計功能,並運用 Gemini 2.5 Pro 預先發布版開發精密的動畫專用演算法、探索複雜的程式碼庫,以及加快平台最佳化作業,協助使用者擴展創意敘事能力。
克服生成式 3D 動態的研發障礙
開發尖端動畫平台不僅需要簡單易用的設計工具,還必須持續創新後端演算法,並有效管理程式碼集。Cartwheel 面臨的挑戰包括快速製作原型和導入複雜的動畫功能、針對效能最佳化龐大的程式碼庫,以及讓開發人員快速瞭解並貢獻大型系統。他們需要強大的 AI 合作夥伴,協助他們大幅提升開發效率。
Cartwheel 如何使用 Imagen 3 和 Gemini 2.5 Pro 預先發布版
Cartwheel 使用 Gemini API 改善面向使用者的創作流程,並輔助內部開發程序。
- 透過 Imagen 3 運用 AI 構思角色:Cartwheel 整合了 Imagen 3 的文字轉圖片功能,讓創作者直接在平台中使用文字提示詞構思及生成獨特的角色圖像。這些量身打造的角色可使用自然語言製作動畫,然後匯出為完全綁定的角色,並在 Maya 或 Blender 等業界標準 3D 編輯軟體中編輯,以便整合至專業製作環境。
-
使用 Gemini 2.5 Pro 搶先版輔助研發和最佳化:Cartwheel 團隊在內部使用 Gemini 2.5 Pro 搶先版,支援工程和研究工作流程:
- 開發演算法:我們使用 Gemini 2.5 Pro 搶先版開發動畫專屬功能,包括用於資料合成的動態模糊演算法、用於混合的拉普拉斯金字塔,以及用於編輯器中姿勢設定的自動反向運動學 (IK)。
- 程式碼探索與偵錯:團隊使用 Gemini 2.5 Pro 搶先版探索複雜的程式碼集、發想新實驗的點子,並協助有效偵錯極端情況,例如複雜的相機旋轉錯誤。
- 運用長脈絡窗口進行程式碼集作業:Gemini 2.5 Pro 搶先版具備長脈絡窗口功能,可處理 Cartwheel 的整個程式碼集。舉例來說,開發人員可將新的程式碼庫 (例如前端) 帶入情境,協助新增功能,或詢問系統架構和功能的高階問題。
提升動畫工作流程效率
Cartwheel 運用 Gemini 2.5 Pro 搶先版輔助演算法開發、程式碼探索和偵錯,希望提升開發流程並加快平台最佳化速度。整合 Imagen 3 後,使用者就能以簡化的方式從文字生成角色圖像,而 Gemini 2.5 Pro 搶先版則可做為工具,協助開發人員建構基礎技術。這些整合功能可協助 Cartwheel 達成目標,讓動畫工作流程更快速且更容易使用,例如:
- 加快遊戲和影片的素材資源製作速度,讓團隊專注於核心設計。
- 協助有效生成行銷和社群媒體內容。
「動畫是將腦海中的故事呈現給世人的最純粹方式之一。我們正在開發相關工具,讓所有人都能更輕鬆地使用這項技術!」
打造動畫的未來
Cartwheel 整合 Imagen 3 和 Gemini 2.5 Pro 預先發布版,充分展現 Google AI 如何應用於新使用者功能,並協助開發新一代工具所需的複雜開發工作。
請參閱 Gemini API 說明文件,瞭解 Imagen 3,並在 Google AI Studio 中開始使用。
Cartwheel 是 Google AI Futures Fund 的參與者,該基金會投資並與雄心勃勃的新創公司合作,共同建構 AI 的未來。