借助 Live API,您可以与 Gemini 2.5 Flash 进行低延迟、实时的语音和视频互动。它能够处理连续的音频、视频或文本流,以提供即时、自然逼真的语音回答,从而为您的用户创造自然的对话体验。
文档
如需全面了解功能和能力,请参阅 Live API 指南。
gemini-2.5-flash-native-audio-preview-12-2025
| 属性 | 说明 |
|---|---|
| 模型代码 |
gemini-2.5-flash-native-audio-preview-12-2025
|
| 支持的数据类型 |
输入源 音频、视频、文字 输出 音频和文字 |
| 令牌限制[*] |
输入 token 限制 131,072 输出 token 限制 8192 |
| 功能 |
音频生成 支持 批量 API 不受支持 缓存 不受支持 代码执行 不受支持 文件搜索 不支持 函数调用 支持 依托 Google 地图进行接地 不受支持 图片生成 不受支持 Live API 支持 搜索接地 支持 结构化输出 不受支持 思考型 支持 网址上下文 不受支持 |
| 版本 |
|
| 最新更新 | 2025 年 9 月 |
| 知识截点 | 2025 年 1 月 |