分享

2024 年 12 月 11 日

Volley 使用 Gemini 2.0 Flash 和 Multimodal Live API 製作音訊優先遊戲原型

最多子項

排球

Vishal Dharmadhikari

產品解決方案工程師

Volley 展示主頁橫幅

Gemini API 可協助開發人員打造新一代沉浸式體驗,而 Volley 則是語音控制 AI 遊戲的領導者。除了 Jeopardy!Song Quiz 等熱門遊戲外,Volley 也以 Gemini 2.0 Flash 的尖端功能 (目前為實驗版),為經典遊戲「20 題」製作音訊優先的全新原型版本。

透過智慧型電視、Amazon Alexa、Google 助理和行動平台,Volley 提供有趣的語音遊戲,吸引了數百萬使用者。如今,他們將目光轉向新的領域:運用生成式 AI 的即時多模態功能,改變休閒遊戲的面貌,首先是「20 個問題」遊戲。

Gemini 2.0 Flash:打造身歷其境的語音遊戲體驗

Volley 的新版「20 個問題」原型設計採用 Gemini 2.0 Flash 的關鍵功能,打造出超越遊戲目前 AI 能力的獨特體驗。雖然經典遊戲會即時產生動態內容,但 Gemini 2.0 Flash 可將其轉變為超凡的內容,提供快速回覆、情感豐富的新個性,以及令人驚豔的對話流程。

Volley 的 20 個問題原型:這是第一個採用 Gemini 2.0 Flash 和 Multimodal Live API 的遊戲 (縮短序列)

Gemini 2.0 Flash 可提供以下協助:

  • 低延遲動態問題和回覆產生:Gemini 2.0 Flash 的原生音訊輸出功能,以及新推出的 Multimodal Live API 帶來的低延遲互動,可讓您與 AI Riddlemaster 進行動態對話。原型設計可讓使用者與 Riddlemaster 自然地進行雙向對話,包括提問、取得提示等。結合模型智慧和長期內容記憶功能,可確保根據玩家互動即時提供個人化體驗。毫秒級延遲可實現真正自然的對話體驗。

  • 語音活動偵測: API 內建功能可讓模型自然地中斷語音,讓使用者無需透過視覺或觸覺輸入,也能流暢地與模型對話。

語音優先遊戲的未來:運用 Gemini 打造

Volley 的願景是讓語音 AI 成為遊戲的核心,為所有人打造易於使用且身歷其境的體驗。該公司致力於 AI 創新,因此在這個令人振奮的新領域中處於領先地位。共同創辦人兼執行長 Max Child 表示:「大型語言模型和語音辨識技術正在改變遊戲,透過動態互動體驗為遊戲注入活力。讓玩家沉浸在生動有趣的冒險旅程中,並透過自己的聲音推動故事發展。」

採用 Gemini 2.0 Flash 的 Multimodal Live API 技術,Volley 推出最新的 20 個問題遊戲,目前仍處於原型設計階段,敬請期待更多資訊。

開始使用 Gemini API:自行建構互動式世界

Volley 運用 Gemini 2.0 Flash 和 Multimodal Live API 的成果,展現 AI 在遊戲中的無限可能,特別是動態遊戲玩法、逼真的角色,以及自然對話的可能性。遊戲開發人員可以運用 Gemini API 的強大功能,打造同樣引人入勝的創新體驗。

請參閱 Gemini API 說明文件,瞭解這項 API 的功能如何協助您打造下一代引人入勝且包容的遊戲。