分享

2024 年 12 月 11 日

Volley 運用 Gemini 2.0 Flash 和 Multimodal Live API,打造以音訊為主的遊戲原型

Max Child

Volley

Vishal Dharmadhikari

產品解決方案工程師

Volley 展示主頁橫幅

Gemini API 協助開發人員打造新一代沉浸式體驗,Volley 則在語音控制 AI 遊戲領域中領先群倫。Volley 曾推出《Jeopardy!》和《Song Quiz》等熱門遊戲,目前正運用 Gemini 2.0 Flash 的尖端功能 (目前為實驗性預先發布版),以《20 Questions》這款經典遊戲為原型,打造全新的語音優先遊戲。

Volley 透過智慧型電視、Amazon Alexa、Google 助理和行動平台,提供引人入勝的語音遊戲,吸引了數百萬名玩家。現在,他們開始跨足新領域:運用生成式 AI 的即時多模態功能,徹底改變休閒遊戲體驗,並以《20 Questions》初試啼聲。

Gemini 2.0 Flash:沉浸式語音遊戲體驗的關鍵

Volley 全新《20 Questions》原型採用 Gemini 2.0 Flash 的主要功能,打造獨一無二的體驗,超越遊戲目前的 AI 功能。經典遊戲會即時生成動態內容,而 Gemini 2.0 Flash 則會將其轉化為非凡體驗,遊戲角色不但反應快速,還具備能展現情感的全新人格特質,感覺就像真人在彼此交談。

Volley 的《20 Questions》原型:首批採用 Gemini 2.0 Flash 和 Multimodal Live API 的遊戲之一 (縮短序列)

Gemini 2.0 Flash 的優勢:

  • 低延遲動態問題和回覆生成:Gemini 2.0 Flash 的原生音訊輸出功能,以及新 Multimodal Live API 帶來的低延遲互動,可讓您與 AI 謎語大師進行動態對話。這個原型可與謎語大師進行自然的來回對話,包括提問、取得提示等。模型智慧結合長脈絡記憶後,即可根據玩家互動即時發展個人化體驗。由於回應延遲時間不到一秒,感覺就像在跟真人自然對話。

  • 語音活動偵測:這項 API 內建功能可讓使用者不需打字或輕觸裝置,即可用語音自然打斷模型回應,進行流暢對話。

語音優先遊戲的未來:Gemini

Volley 的未來願景是,讓語音 AI 成為遊戲體驗的核心,為所有人打造無障礙的沉浸式體驗。面對這股令人振奮的 AI 新浪潮,該公司正因為致力於創新,也因此站上風口浪尖。共同創辦人兼執行長 Max Child 補充說:「大型語言模型和語音辨識技術正在改變遊戲,透過動態互動式體驗,讓遊戲歷程更如幻似真。玩家因此能沉浸在生動有趣的冒險中,透過自己的聲音推動故事發展。」

Volley 最新推出的《20 Questions》遊戲採用 Gemini 2.0 Flash 的 Multimodal Live API,目前仍處於原型設計階段,但近期將釋出更多新動態,敬請期待。

開始使用 Gemini API:打造專屬的互動宇宙

Volley 運用 Gemini 2.0 Flash 和 Multimodal Live API,展現 AI 在遊戲領域的無限可能,特別是動態遊戲體驗、栩栩如生的角色,以及自然流暢的對話。遊戲開發人員可以運用 Gemini API 的強大功能,打造類似的沉浸式創新體驗。

請參閱 Gemini API 說明文件,瞭解如何運用這項技術打造引人入勝的新一代無障礙遊戲。