2024 年 12 月 11 日
Volley 運用 Gemini 2.0 Flash 和 Multimodal Live API,打造以音訊為主的遊戲原型

Gemini API 協助開發人員打造新一代沉浸式體驗,Volley 則在聲控 AI 遊戲領域中領先群倫。Volley 曾推出《Jeopardy!》和《Song Quiz》等熱門遊戲,目前正運用 Gemini 2.0 Flash 的尖端功能 (目前為實驗性預先發布版),以 20 Questions 這款經典遊戲為原型,打造全新的語音優先遊戲。
Volley 透過智慧型電視、Amazon Alexa、Google 助理和行動平台,提供引人入勝的語音遊戲,吸引了數百萬名玩家。現在,他們將目光投向新領域:運用生成式 AI 的即時多模態功能,徹底改變休閒遊戲體驗,首先推出的是「20 Questions」。
Gemini 2.0 Flash:打造沉浸式語音遊戲體驗的關鍵
Volley 全新「20 Questions」原型採用 Gemini 2.0 Flash 的主要功能,打造獨一無二的體驗,超越遊戲目前的 AI 功能。經典遊戲會即時生成動態內容,而 Gemini 2.0 Flash 則會將其轉化為非凡體驗,提供極速回覆、全新情緒化角色,以及極度貼近人類的對話流程。
Gemini 2.0 Flash 的優勢:
低延遲動態生成問題和回覆:Gemini 2.0 Flash 的原生音訊輸出功能,以及透過全新 Multimodal Live API 實現的低延遲互動,可與 AI 謎語大師進行動態對話。這個原型可與謎語大師進行自然對話,包括提問、取得提示等。模型智慧和長脈絡記憶體的結合,可確保根據玩家互動即時演變的個人化體驗。延遲時間不到一秒,可實現真正自然的擬人對話。
語音活動偵測: 這項 API 內建功能可讓使用者自然地打斷模型的回應,進行流暢且易於使用的對話,無需視覺或觸覺輸入。
語音優先遊戲的未來:Gemini 賦予的強大力量
Volley 認為語音 AI 將成為遊戲體驗的核心,為所有人打造無障礙的沉浸式體驗。該公司致力於 AI 創新,因此走在令人振奮的新領域最前端。共同創辦人兼執行長 Max Child 說明:「大型語言模型和語音辨識技術正在改變遊戲,透過動態互動式體驗,讓遊戲栩栩如生。讓玩家沉浸在生動有趣的冒險中,透過自己的聲音推動故事發展。」
Volley 最新推出的「20 Questions」遊戲採用 Gemini 2.0 Flash 的 Multimodal Live API,目前仍處於原型設計階段,敬請期待更多資訊。
開始使用 Gemini API:建構自己的互動式世界
Volley 運用 Gemini 2.0 Flash 和 Multimodal Live API,展現 AI 在遊戲領域的無限可能,特別是動態遊戲體驗、栩栩如生的角色,以及自然流暢的對話。遊戲開發人員可以運用 Gemini API 的強大功能,打造類似的沉浸式創新體驗。
請參閱 Gemini API 說明文件,瞭解如何運用這項技術打造新一代引人入勝的無障礙遊戲。