Gemini 2.5 Flash 实时预览

借助 Live API,您可以与 Gemini 2.5 Flash 进行低延迟、实时的语音和视频互动。它能够处理连续的音频、视频或文本流,以提供即时、自然逼真的语音回答,从而为您的用户创造自然的对话体验。

文档

如需全面了解功能和能力,请参阅 Live API 指南。

gemini-2.5-flash-native-audio-preview-12-2025

属性 说明
模型代码 gemini-2.5-flash-native-audio-preview-12-2025
支持的数据类型

输入源

音频、视频、文字

输出

音频和文字

令牌限制[*]

输入 token 限制

131,072

输出 token 限制

8192

功能

音频生成

支持

批量 API

不受支持

缓存

不受支持

代码执行

不受支持

文件搜索

不支持

函数调用

支持

依托 Google 地图进行接地

不受支持

图片生成

不受支持

Live API

支持

搜索接地

支持

结构化输出

不受支持

思考型

支持

网址上下文

不受支持

版本
如需了解详情,请参阅模型版本模式
  • 预览:gemini-2.5-flash-native-audio-preview-12-2025
  • 预览:gemini-2.5-flash-native-audio-preview-09-2025
最新更新 2025 年 9 月
知识截点 2025 年 1 月