2025 年 5 月 16 日
Cartwheel 運用 Gemini API 提升角色動畫品質
Cartwheel 運用 Gemini API 提升角色動畫技術
Cartwheel 採用新一代動畫技術,提供可輸入自然語言 (例如「一隻貓在跳舞」) 的平台,「跳躍」、「莎莎舞旋轉」) 等直接角色動作。這項創新技術可提升創作者製作影片、遊戲、廣告和社群媒體動畫的效率。Cartwheel 整合 Imagen 3,提供直覺的文字轉角色設計功能,並運用 Gemini 2.5 Pro 預先發布版開發精密的動畫專用演算法、探索複雜的程式碼庫,以及加快平台最佳化作業,協助使用者拓展創意敘事能力。
克服生成式 3D 動態的研發障礙
開發尖端動畫平台不僅需要簡單易用的設計工具,還需要持續創新後端演算法,並有效管理程式碼集。Cartwheel 面臨的挑戰包括快速製作原型和導入複雜的動畫功能、針對效能最佳化龐大的程式碼集,以及讓開發人員快速瞭解並貢獻大型系統。他們需要強大的 AI 合作夥伴,協助提升開發工作效率。
Cartwheel 如何使用 Imagen 3 和 Gemini 2.5 Pro 預先發布版
Cartwheel 使用 Gemini API 改善面向使用者的創作流程,並輔助內部開發程序。
- 透過 Imagen 3 運用 AI 構思角色:Cartwheel 整合了 Imagen 3 的文字轉圖像功能,讓創作者直接在平台中使用文字提示詞構思及生成獨特的角色圖像。這些量身打造的角色可使用自然語言製作動畫,然後匯出完整裝備,並在 Maya 或 Blender 等業界標準 3D 編輯軟體中編輯,以便整合至專業製作環境。
-
使用 Gemini 2.5 Pro 搶先版輔助研發和最佳化:Cartwheel 團隊在內部使用 Gemini 2.5 Pro 搶先版,支援工程和研究工作流程:
- 開發演算法:我們使用 Gemini 2.5 Pro 搶先版開發動畫專屬功能,包括資料合成的動態模糊演算法、混合的拉普拉斯金字塔,以及編輯器內擺姿勢的自動反向運動學 (IK)。
- 程式碼探索與調試: 團隊使用 Gemini 2.5 Pro Preview 來探索複雜的程式碼庫,為新的實驗產生想法,並協助高效地調試邊緣情況,例如複雜的相機旋轉錯誤。
- 運用長脈絡窗口進行程式碼集作業:Gemini 2.5 Pro 搶先版的長脈絡窗口功能可用於處理 Cartwheel 的整個程式碼集。舉例來說,開發人員可以將新的程式碼庫 (例如前端) 帶入情境,協助新增功能,或詢問系統架構和功能的高階問題。
增強動畫工作流程
Cartwheel 打算使用 Gemini 2.5 Pro 搶先版輔助演算法開發、程式碼探索和偵錯,藉此提升開發程序,並加快平台最佳化速度。整合 Imagen 3 後,使用者就能以簡化的方式從文字生成角色圖像,而 Gemini 2.5 Pro 搶先版則可做為工具,協助開發人員建構基礎技術。這些整合功能可協助 Cartwheel 達成目標,讓動畫工作流程更快速且更容易使用,例如:
- 加速遊戲和影片的素材資源製作流程,讓團隊專注於核心設計。
- 促進高效的行銷和社群媒體內容產生。
「動畫是將腦海中的故事呈現給世人的最純粹方式之一。我們正在開發相關工具,讓所有人都能輕鬆使用這項技術!」
建構動畫的未來
Cartwheel 整合 Imagen 3 和 Gemini 2.5 Pro 預先發布版,充分展現 Google AI 的應用潛力,不僅能提供全新使用者功能,還能協助開發新一代工具所需的複雜開發工作。
探索 Gemini API 文件,瞭解 Imagen 3,並開始使用 Google AI Studio。
Cartwheel 是 Google AI Futures Fund 的參與者,該基金會投資並與雄心勃勃的新創公司合作,共同打造 AI 的未來。