分享

2024 年 12 月 11 日

Volley 使用 Gemini 2.0 Flash 和 Multimodal Live API 对以音频为主的游戏进行了原型设计

最大子级

Volley

Vishal Dharmadhikari

产品解决方案工程师

Volley 展示效果主图

Gemini API 可帮助开发者打造新一代沉浸式体验,而 Volley 则在语音控制 AI 游戏领域处于领先地位。Volley 以Jeopardy!Song Quiz 等热门游戏而闻名,目前正在利用Gemini 2.0 Flash(目前处于实验性预览阶段)的尖端功能,对经典游戏“20 个问题”进行重新构想,打造以音频为主的新版本。

通过在智能电视、Amazon Alexa、Google 助理和移动平台上提供富有吸引力的语音游戏,Volley 吸引了数百万人。现在,他们将目光投向了新的领域:利用生成式 AI 的实时多模式功能,改造休闲游戏,从“20 个问题”开始。

Gemini 2.0 Flash:沉浸式语音游戏体验的关键

Volley 的新“20 个问题”原型采用 Gemini 2.0 Flash 的关键功能,打造出真正独特的体验,超越该游戏目前的 AI 功能。虽然传统游戏会实时生成动态内容,但 Gemini 2.0 Flash 会将其转变为非凡的体验,带来极速响应、富有情感的新个性,以及令人惊叹的人性化对话流程。

Volley 的“20 个问题”游戏的原型:这是首批采用 Gemini 2.0 Flash 和 Multimodal Live API 的游戏之一(缩减了序列)

Gemini 2.0 Flash 的助力作用如下:

  • 低延迟动态问题和回答生成:Gemini 2.0 Flash 的原生音频输出以及新版 Multimodal Live API 带来的低延迟互动,让用户能够与 AI 谜题大师进行动态对话。该原型可让用户与 Riddlemaster 进行自然的互动对话:提问、获取提示等。模型智能与长时情境记忆相结合,可确保根据玩家互动实时调整个性化体验。低于一秒的延迟时间可实现真正自然的对话。

  • 语音活动检测 :该 API 内置的功能可允许用户以自然的语音中断模型的回答,从而实现流畅、方便的对话,无需视觉或触感输入。

以语音为先的游戏的未来:由 Gemini 赋能

Volley 设想未来的游戏将以语音 AI 为核心,为所有人打造无障碍的沉浸式体验。该公司致力于 AI 创新,因此在这一令人兴奋的新领域处于领先地位。正如联合创始人兼首席执行官 Max Child 所说:“LLM 和语音识别技术正在改变游戏,通过动态互动体验为游戏注入活力。让玩家能够沉浸在生动有趣的冒险中,并通过自己的声音真正推动故事的发展。”

由 Gemini 2.0 Flash 的 Multimodal Live API 提供支持的 Volley 最新“20 个问题”游戏仍处于原型阶段,敬请关注我们,我们很快就会提供更多信息。

Gemini API 使用入门:构建您自己的交互式世界

Volley 与 Gemini 2.0 Flash 和 Multimodal Live API 的结合运用,展示了 AI 在游戏领域的诸多令人兴奋的可能性,尤其是在打造动态游戏内容、逼真的角色和自然对话方面。作为游戏开发者,您可以利用 Gemini API 的强大功能,打造同样身临其境且富有创新性的体验。

探索 Gemini API 文档,了解其功能如何助力您构建富有吸引力且包容性强的下一代游戏。