2025 年 5 月 16 日
Volley 借助 Gemini 2.5 和 Veo 2 打造沉浸式语音 AI 地牢冒险游戏

Volley Crafts 利用 Gemini 2.5 和 Veo 2 打造沉浸式语音 AI 地牢冒险游戏
Volley 成功打造了由 Gemini 2.0 Flash 提供支持的“20 个问题”原型,在此基础上,他们再次突破互动式音频娱乐的界限,开发出首款语音 AI 地牢爬行游戏。这项新计划展示了 Gemini 2.0 Flash 的图片生成功能和 Veo 2 如何生成令人惊叹的游戏内视觉效果,而 Gemini 2.5 Pro Preview 的编码功能正在彻底改变游戏开发流程本身,最终打造出无与伦比的沉浸式冒险体验。
从快节奏的问答到丰富的视觉冒险
Volley 凭借其语音控制游戏吸引了数百万用户。他们最初的“20 个问题”原型展示了 Gemini 2.5 Pro 在快速响应和进行富有吸引力的来回对话方面的潜力。现在,Volley 利用 Gemini 2.5 Pro 预览版功能和 Google 的 Veo 2 视频生成模型,打造出动态的地牢探索体验。目标:打造一款以音频为主的冒险游戏,其中每个互动角色都由 AI 生成,可动态创建丰富的游戏内视觉效果。
打造全新的语音控制游戏体验
这款雄心勃勃的地牢爬行游戏原型利用了 Gemini 模型和 Veo 2 的特定改进:
- 借助 Imagen 3 实现 AI 驱动的角色概念化:Cartwheel 集成了 Imagen 3 的文本转图片功能,让创作者能够使用文本提示直接在平台内构思和生成独特的角色视觉效果。这些自定义设计的角色可以使用自然语言进行动画处理,然后导出为完全绑定且可用于 Maya 或 Blender 等行业标准 3D 编辑软件的角色,从而集成到专业制作环境中。
-
利用 Gemini 2.5 Pro 预览版协助研发和优化:Cartwheel 团队在内部使用 Gemini 2.5 Pro 预览版来支持其工程和研究工作流程:
- 使用 Gemini 2.0 Flash 和 Veo 2 生成动态游戏图像:为了完善语音优先体验,Volley 正在利用 Gemini 2.0 Flash 的图像生成功能和 Veo 2 的强大功能来打造充满活力的视觉维度。用途包括生成概念艺术、角色视觉效果、关键地点和事件的动态场景设置图片,以及游戏内物品和环境的图像,所有这些都是为了加深玩家的沉浸感。
- 将 Gemini 2.5 Pro 预览版用作游戏开发工具:Volley 正在利用 Gemini 2.5 Pro 预览版的高级推理和编码功能来简化和增强开发流程。这包括加快游戏逻辑和任务系统的编写和调试速度、快速制作新游戏机制的原型,以及协助生成基础叙事内容、情节要点和角色背景故事,供开发团队在此基础上进行构建。
不断演进的语音优先沉浸式游戏
这款全新的地牢爬行游戏原型利用 AI 技术,体现了 Volley 对易于上手且具有深度沉浸感的游戏的愿景。该项目旨在利用“20 个问题”原型中发现的优势(快速、感性且自然的对话流程),并将其应用到更复杂、视觉效果更出色的冒险游戏中。
Volley 正在开发一款游戏,其中语音互动推动故事发展,并辅以丰富的视觉效果。为此,Volley 使用 Gemini 2.0 Flash 进行图片生成,使用 Veo 2 制作视觉效果,并使用 Gemini 2.5 Pro 预览版来辅助开发。
正如 Volley 联合创始人兼首席执行官 Max Child 之前所说,而这与这项新业务的契合度更高:“LLM 和语音识别技术正在改变游戏,通过动态的互动体验为游戏注入活力。让玩家沉浸在生动有趣、引人入胜的冒险中,真正通过自己的声音来推动故事发展。”这款地下城爬行游戏借助 AI 辅助创作,直接体现了这一愿景,承诺打造一款让玩家的每一句话都能影响前进道路的游戏。
Gemini API 使用入门:打造属于自己的冒险之旅
Volley 的开创性工作展示了 Google 的 AI 模型在打造新一代创新且富有吸引力的游戏体验方面的潜力。开发者可以利用 Gemini 2.0 Flash 的图片生成功能、Veo 2 的出色视频和图片生成功能,以及 Gemini 2.5 Pro 预览版的先进编码和内容辅助功能,构建自己的互动世界。
准备好构建了吗?立即探索 Gemini API 文档并开始使用 Google AI Studio。
Volley 是 Google 的 AI Futures Fund 的参与者,该基金会投资于有远见的初创公司,并与这些公司合作,共同打造下一代 AI 产品。