我们速度最快的引擎,可实现高保真语音合成,提供低延迟且经济高效的音频生成服务。Gemini 2.5 Flash TTS 最适合实时助理、大批量旁白和对话式应用场景,这些场景需要对语音风格和节奏进行精细控制。
文档
如需全面了解功能和特性,请参阅文字转语音指南。
gemini-2.5-flash-preview-tts
| 属性 | 说明 |
|---|---|
| 模型代码 | gemini-2.5-flash-preview-tts |
| 支持的数据类型 |
输入源 文本 输出 音频 |
| 令牌限制[*] |
输入 token 限制 8192 输出 token 限制 16384 |
| 功能 |
音频生成 支持 批量 API 支持 缓存 不受支持 代码执行 不受支持 文件搜索 不支持 函数调用 不受支持 依托 Google 地图进行接地 不受支持 图片生成 不受支持 Live API 不受支持 搜索接地 不受支持 结构化输出 不受支持 思考型 不受支持 网址上下文 不受支持 |
| 版本 |
|
| 最新更新 | 2025 年 12 月 |