分享

2024 年 12 月 11 日

Volley 運用 Gemini 2.0 Flash 和 Multimodal Live API,打造以音訊為主的遊戲原型

Max Child

排球

Vishal Dharmadhikari

產品解決方案工程師

Volley 展示主頁橫幅

Gemini API 協助開發人員打造新一代沉浸式體驗,Volley 則在聲控 AI 遊戲領域中領先群倫。Volley 曾推出《Jeopardy!》和《Song Quiz》等熱門遊戲,目前正運用 Gemini 2.0 Flash 的尖端功能 (目前為實驗性預先發布版),以 20 Questions 這款經典遊戲為原型,打造全新的語音優先遊戲。

Volley 透過智慧型電視、Amazon Alexa、Google 助理和行動平台,提供引人入勝的語音遊戲,吸引了數百萬名玩家。現在,他們將目光投向新領域:運用生成式 AI 的即時多模態功能,徹底改變休閒遊戲體驗,首先推出的是「20 Questions」。

Gemini 2.0 Flash:打造沉浸式語音遊戲體驗的關鍵

Volley 全新「20 Questions」原型採用 Gemini 2.0 Flash 的主要功能,打造獨一無二的體驗,超越遊戲目前的 AI 功能。經典遊戲會即時生成動態內容,而 Gemini 2.0 Flash 則會將其轉化為非凡體驗,提供極速回覆、全新情緒化角色,以及極度貼近人類的對話流程。

Volley 的「20 Questions」原型:首批採用 Gemini 2.0 Flash 和 Multimodal Live API 的遊戲之一 (縮短序列)

Gemini 2.0 Flash 的優勢:

  • 低延遲動態生成問題和回覆:Gemini 2.0 Flash 的原生音訊輸出功能,以及透過全新 Multimodal Live API 實現的低延遲互動,可與 AI 謎語大師進行動態對話。這個原型可與謎語大師進行自然對話,包括提問、取得提示等。模型智慧和長脈絡記憶體的結合,可確保根據玩家互動即時演變的個人化體驗。延遲時間不到一秒,可實現真正自然的擬人對話。

  • 語音活動偵測: 這項 API 內建功能可讓使用者自然地打斷模型的回應,進行流暢且易於使用的對話,無需視覺或觸覺輸入。

語音優先遊戲的未來:Gemini 賦予的強大力量

Volley 認為語音 AI 將成為遊戲體驗的核心,為所有人打造無障礙的沉浸式體驗。該公司致力於 AI 創新,因此走在令人振奮的新領域最前端。共同創辦人兼執行長 Max Child 說明:「大型語言模型和語音辨識技術正在改變遊戲,透過動態互動式體驗,讓遊戲栩栩如生。讓玩家沉浸在生動有趣的冒險中,透過自己的聲音推動故事發展。」

Volley 最新推出的「20 Questions」遊戲採用 Gemini 2.0 Flash 的 Multimodal Live API,目前仍處於原型設計階段,敬請期待更多資訊。

開始使用 Gemini API:建構自己的互動式世界

Volley 運用 Gemini 2.0 Flash 和 Multimodal Live API,展現 AI 在遊戲領域的無限可能,特別是動態遊戲體驗、栩栩如生的角色,以及自然流暢的對話。遊戲開發人員可以運用 Gemini API 的強大功能,打造類似的沉浸式創新體驗。

請參閱 Gemini API 說明文件,瞭解如何運用這項技術打造新一代引人入勝的無障礙遊戲。