Interactions API 现已正式发布。我们建议使用此 API 来访问所有最新功能和模型。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini 2.5 Flash 文字转语音

我们速度最快的引擎，可实现高保真语音合成，提供低延迟且经济高效的音频生成。Gemini 2.5 Flash TTS 最适合实时助理、大体量旁白和对话式应用场景，这些场景需要对语音风格和语速进行精细控制。

文档

如需全面了解功能和特性，请参阅文字转语音指南。

属性	说明
模型代码	`gemini-2.5-flash-preview-tts`
支持的数据类型	输入源文字输出音频
令牌限制^[*]	输入 token 限制 8192 输出 token 限制 16384
功能	音频生成支持缓存不受支持代码执行不受支持文件搜索不支持函数调用不受支持 Grounding with Google Maps 不受支持图片生成不受支持 Live API 不受支持搜索接地不受支持结构化输出不受支持思考型不受支持网址上下文不受支持
使用选项	Batch API 支持灵活推理不受支持优先推断不受支持
版本	如需了解详情，请参阅模型版本模式。 `gemini-2.5-flash-preview-tts`
最新更新	2025 年 12 月