分享

2024 年 12 月 11 日

Volley 使用 Gemini 2.0 Flash 和 Multimodal Live API 製作音訊優先遊戲原型

最多子項

排球

Vishal Dharmadhikari

產品解決方案工程師

Volley 主頁橫幅

Gemini API 可協助開發人員打造新一代的沉浸式體驗,而 Volley 則是語音控制 AI 遊戲領域的領導者。除了 Jeopardy!Song Quiz 等熱門遊戲,Volley 也推出了許多其他遊戲,而這些遊戲都運用了 Gemini 2.0 Flash 的尖端功能 (目前為實驗版),以全新的音訊優先方式重現經典遊戲「20 Questions」。

透過智慧型電視、Amazon Alexa、Google 助理和行動平台,Volley 提供有趣的語音遊戲,吸引了數百萬名使用者。如今,他們將目光轉向新領域:運用生成式 AI 的即時多模態功能,改造休閒遊戲,首先是「20 個問題」。

Gemini 2.0 Flash:打造身歷式語音遊戲的關鍵

Volley 的新版「20 個問題」原型設計採用 Gemini 2.0 Flash 的關鍵功能,打造出超越遊戲目前 AI 功能的獨特體驗。雖然傳統遊戲會即時產生動態內容,但 Gemini 2.0 Flash 可將其轉變為超乎尋常的內容,提供快速回覆、情感豐富的新個性,以及極為自然的對話流程。

Volley 的 20 個問題原型:這是第一個採用 Gemini 2.0 Flash 和 Multimodal Live API 的遊戲 (縮短序列)

Gemini 2.0 Flash 可提供以下協助:

  • 低延遲動態問題和回覆產生功能:Gemini 2.0 Flash 的原生音訊輸出功能,以及新推出的 Multimodal Live API 提供的低延遲互動功能,可讓您與 AI Riddlemaster 進行即時對話。原型設計可讓使用者與 Riddlemaster 自然地進行雙向對話,例如提出問題、取得提示等。結合模型智慧和長期內容記憶功能,可確保根據玩家互動即時提供個人化體驗。毫秒級延遲可實現真正自然的對話體驗。

  • Voice Activity Detection: 這個 API 內建的功能可讓模型回應自然地中斷,讓使用者不必透過視覺或觸覺輸入內容,也能流暢地與模型對話。

語音優先遊戲的未來:運用 Gemini 技術

Volley 的願景是讓語音 AI 成為遊戲的核心,為所有人打造易於使用且身歷其境的體驗。該公司致力於 AI 創新,因此在這個令人振奮的新領域中走在前端。共同創辦人兼執行長 Max Child 表示:「大型語言模型和語音辨識技術正在改變遊戲,透過動態互動體驗為遊戲注入生命力。讓玩家沉浸在生動有趣的冒險旅程中,並以自己的聲音推動故事發展。」

採用 Gemini 2.0 Flash 的多模態即時 API 技術,Volley 推出最新的 20 個問題遊戲,目前仍處於原型設計階段,敬請期待我們稍後提供更多資訊。

開始使用 Gemini API:自行建構互動式世界

Volley 運用 Gemini 2.0 Flash 和多模態即時 API 的成果,展現 AI 在遊戲中的無限可能,特別是動態遊戲玩法、逼真的角色,以及自然對話的可能性。遊戲開發人員可以運用 Gemini API 的強大功能,打造同樣引人入勝的創新體驗。

請參閱 Gemini API 說明文件,瞭解這項 API 的功能如何協助您打造下一代引人入勝且包容的遊戲。