Gemini 2.5 Flash 文字转语音

我们速度最快的引擎,可实现高保真语音合成,提供低延迟且经济高效的音频生成。Gemini 2.5 Flash TTS 最适合实时助理、大体量旁白和对话式应用场景,这些场景需要对语音风格和语速进行精细控制。

文档

如需全面了解功能和特性,请参阅文字转语音指南。

gemini-2.5-flash-preview-tts

属性 说明
模型代码 gemini-2.5-flash-preview-tts
支持的数据类型

输入源

文字

输出

音频

令牌限制[*]

输入 token 限制

8192

输出 token 限制

16384

功能

音频生成

支持

缓存

不受支持

代码执行

不受支持

文件搜索

不支持

函数调用

不受支持

Grounding with Google Maps

不受支持

图片生成

不受支持

Live API

不受支持

搜索接地

不受支持

结构化输出

不受支持

思考型

不受支持

网址上下文

不受支持

使用选项

Batch API

支持

灵活推理

不受支持

优先推断

不受支持

版本
如需了解详情,请参阅模型版本模式
  • gemini-2.5-flash-preview-tts
最新更新 2025 年 12 月