分享

2024 年 12 月 11 日

Volley 使用 Gemini 2.0 Flash 和 Multimodal Live API 打造了一款音频优先游戏

Max Child

Volley

Vishal Dharmadhikari

产品解决方案工程师

Volley 展示主打图片

Gemini API 助力开发者打造新一代沉浸式体验,而 Volley 在语音控制 AI 游戏领域处于领先地位。Volley 以《Jeopardy!》和《Song Quiz》等热门游戏而闻名,目前正利用 Gemini 2.0 Flash(目前处于实验性预览阶段)的先进功能,为经典游戏“20 Questions”打造全新的音频优先体验。

Volley 凭借其精彩的语音游戏吸引了数百万用户,这些游戏可在智能电视、Amazon Alexa、Google 助理和移动平台上畅玩。现在,他们将目光投向了一个新的领域:利用生成式 AI 的实时多模态功能来改变休闲游戏,首先从“20 个问题”开始。

Gemini 2.0 Flash:打造沉浸式语音游戏体验的关键

Volley 的全新“20 个问题”原型利用 Gemini 2.0 Flash 的关键功能,打造出超越游戏当前 AI 功能的独特体验。虽然经典游戏具有动态生成的内容,但 Gemini 2.0 Flash 将其转变为非凡的体验,带来极快的回答速度、富有情感的新角色,以及非常贴近人类的对话流程。

Volley 的“20 个问题”原型:首批由 Gemini 2.0 Flash 和多模态 Live API 提供支持的游戏之一(序列已缩短)

Gemini 2.0 Flash 可提供以下帮助:

  • 低延迟动态问题和回答生成:Gemini 2.0 Flash 的原生音频输出和全新 Multimodal Live API 实现的低延迟互动,让您能够与 AI 谜语大师进行动态对话。该原型支持与猜谜大师进行自然流畅的对话,包括提问、获取提示等。模型智能与长情境记忆相结合,可确保根据玩家互动实时打造个性化体验。亚秒级延迟可实现真正自然的人类式对话。

  • 语音活动检测: 该 API 的内置功能可实现自然的语音中断,从而实现流畅、易于访问的对话,而无需视觉或触觉输入。

语音优先游戏的未来:由 Gemini 提供支持

Volley 设想的未来是,语音 AI 将成为游戏玩法的核心,为所有人打造无障碍的沉浸式体验。该公司致力于 AI 创新,这使其走在了这一令人兴奋的新领域的前沿。联合创始人兼 CEO Max Child 详细阐述道:“LLM 和语音识别技术正在改变游戏,通过动态的互动体验为游戏注入活力。让玩家沉浸在生动有趣、引人入胜的冒险中,真正通过自己的声音来推动故事发展。”

Volley 的最新“20 个问题”游戏由 Gemini 2.0 Flash 的 Multimodal Live API 提供支持,目前仍处于原型设计阶段,但请继续关注,我们很快会发布更多信息。

Gemini API 使用入门:打造您自己的互动世界

Volley 结合使用 Gemini 2.0 Flash 和 Multimodal Live API,展示了 AI 在游戏领域的巨大潜力,尤其是在动态游戏体验、逼真角色和自然对话方面的潜力。作为游戏开发者,您可以利用 Gemini API 的强大功能来打造同样沉浸式且创新的体验。

探索 Gemini API 文档,了解其功能如何助力您打造新一代富有吸引力且包容性强的游戏。