分享

2024 年 12 月 11 日

Volley 使用 Gemini 2.0 Flash 和多模态 Live API 打造了一款音频优先的游戏

Max Child

Volley

Vishal Dharmadhikari

产品解决方案工程师

Volley 精选案例主图

Gemini API 助力开发者打造新一代沉浸式体验,而 Volley 在语音控制 AI 游戏领域处于领先地位。Volley 以《Jeopardy!》和《Song Quiz》等热门游戏而闻名,目前正在利用 Gemini 2.0 Flash(目前处于实验性预览阶段)的先进功能,为经典游戏“20 Questions”打造全新的音频优先体验。

Volley 凭借其精彩的语音游戏吸引了数百万用户,这些游戏可在智能电视、Amazon Alexa、Google 助理和移动平台上畅玩。现在,他们正将目光投向新的前沿领域:利用生成式 AI 的实时多模态功能来改变休闲游戏,首先从“20 个问题”游戏开始。

Gemini 2.0 Flash:打造沉浸式语音游戏体验的关键

Volley 的全新“20 个问题”原型利用 Gemini 2.0 Flash 的关键功能,打造出超越游戏当前 AI 功能的独特体验。虽然经典游戏具有可即时生成的动态内容,但 Gemini 2.0 Flash 将其转变为非凡的体验,带来极快的回答速度、富有情感的新角色,以及非常贴近人类的对话流程。

Volley 的“20 个问题”原型:首批由 Gemini 2.0 Flash 和多模态 Live API 提供支持的游戏之一(序列已缩短)

Gemini 2.0 Flash 可提供以下帮助:

  • 低延迟动态问题和回答生成:Gemini 2.0 Flash 的原生音频输出和全新 Multimodal Live API 实现的低延迟互动,让您能够与 AI 谜语大师进行动态对话。该原型支持与 Riddlemaster 进行自然流畅的对话,包括提问、获取提示等。通过将模型智能与长情境记忆相结合,可确保根据玩家互动实时打造不断变化的个性化体验。亚秒级延迟可实现真正自然的人类式对话。

  • 语音活动检测: 该 API 的内置功能可实现自然的语音中断,从而实现流畅、无障碍的对话,而无需视觉或触觉输入。

语音优先游戏的未来:由 Gemini 提供支持

Volley 设想,未来语音 AI 将成为游戏的核心,为所有人创造便捷且沉浸式的体验。该公司致力于 AI 创新,使其能够走在这项令人兴奋的新技术的前沿。正如联合创始人兼首席执行官 Max Child 所阐述的那样,“LLM 和语音识别技术正在改变游戏,通过动态的、互动式的体验为游戏注入活力。让玩家沉浸在生动有趣、引人入胜的冒险中,真正通过自己的声音来推动故事发展。”

Volley 最新推出的 20 Questions 游戏,由 Gemini 2.0 Flash 的多模态实时 API 提供支持,目前仍处于原型开发阶段,敬请期待更多信息。

Gemini API 入门指南:构建您自己的交互式世界

Volley 与 Gemini 2.0 Flash 和多模态实时 API 的合作,展现了人工智能在游戏中的无限可能,尤其是在动态游戏玩法、逼真角色和自然对话方面的潜力。作为游戏开发者,您可以利用 Gemini API 的强大功能来创造类似的沉浸式和创新体验。

探索 Gemini API 文档,了解其功能如何助力您打造新一代富有吸引力且包容性强的游戏。