分享

2024 年 12 月 11 日

Volley 使用 Gemini 2.0 Flash 和多模态 Live API 打造了一款以音频为主的游戏原型

Max Child

Volley

Vishal Dharmadhikari

产品解决方案工程师

Volley 精选案例主图

Gemini API 助力开发者打造新一代沉浸式体验,而 Volley 在语音控制 AI 游戏领域处于领先地位。Volley 以《Jeopardy!》和《Song Quiz》等热门游戏而闻名,目前正在利用 Gemini 2.0 Flash(目前处于实验性预览阶段)的先进功能,为经典游戏“20 Questions”打造全新的音频优先体验。

Volley 凭借其精彩的语音游戏吸引了数百万用户,这些游戏可在智能电视、Amazon Alexa、Google 助理和移动平台上畅玩。现在,他们将目光投向了一个新的领域:利用生成式 AI 的实时多模态功能来改变休闲游戏,首先从“20 个问题”开始。

Gemini 2.0 Flash:打造沉浸式语音游戏体验的关键

Volley 的全新“20 个问题”原型利用 Gemini 2.0 Flash 的关键功能,打造出超越游戏当前 AI 功能的独特体验。虽然经典游戏具有可即时生成的动态内容,但 Gemini 2.0 Flash 将其转变为非凡的体验,带来极快的回答速度、富有情感的新角色,以及非常贴近人类的对话流程。

Volley 的“20 个问题”原型:首批由 Gemini 2.0 Flash 和多模态 Live API 提供支持的游戏之一(序列已缩短)

Gemini 2.0 Flash 可提供以下帮助:

  • 低延迟动态问题和回答生成:Gemini 2.0 Flash 的原生音频输出和全新 Multimodal Live API 实现的低延迟互动,让您能够与 AI 谜语大师进行动态对话。该原型支持与谜语大师进行自然流畅的对话,包括提问、获取提示等。模型智能与长情境记忆相结合,可确保根据玩家互动实时打造个性化体验。亚秒级延迟可实现真正自然的人类式对话。

  • 语音活动检测: 该 API 的内置功能可实现自然的语音中断,从而实现流畅、易于访问的对话,而无需视觉或触觉输入。

语音优先游戏的未来:由 Gemini 提供支持

Volley 设想的未来是,语音 AI 将成为游戏玩法的核心,为所有人打造无障碍的沉浸式体验。该公司致力于 AI 创新,这使其走在了这一令人兴奋的新领域的前沿。联合创始人兼 CEO Max Child 详细阐述道:“LLM 和语音识别技术正在改变游戏,通过动态的互动体验为游戏注入活力。让玩家沉浸在生动有趣、引人入胜的冒险中,真正通过自己的声音来推动故事发展。”

Volley 的最新“20 个问题”游戏由 Gemini 2.0 Flash 的 Multimodal Live API 提供支持,目前仍处于原型设计阶段,但请继续关注,我们很快会发布更多信息。

Gemini API 使用入门:打造您自己的互动世界

Volley 与 Gemini 2.0 Flash 和 Multimodal Live API 的合作展示了 AI 在游戏领域的巨大潜力,尤其是在动态游戏体验、逼真角色和自然对话方面的潜力。作为游戏开发者,您可以利用 Gemini API 的强大功能来打造同样沉浸式且创新的体验。

探索 Gemini API 文档,了解其功能如何助力您打造新一代富有吸引力且包容性强的游戏。