Gemini 2.5 Pro Text-to-Speech

我们的优质引擎，可用于生成录音室品质的语音，提供高保真且精细的音频生成功能。Gemini 2.5 Pro TTS 最适合长篇内容、专业旁白和复杂的创意工作流，这些工作流需要最高水平的语音清晰度和自然韵律。

文档

如需全面了解功能，请参阅文本转语音指南。

属性	说明
模型代码	`gemini-2.5-pro-preview-tts`
支持的数据类型	输入源文字输出音频
Token 限制^[*]	输入 token 限制 8,192 输出 token 限制 16,384
功能	音频生成支持缓存不支持代码执行不支持文件搜索不支持函数调用不支持 Grounding with Google Maps 不支持图片生成不支持 Live API 不支持搜索接地不支持结构化输出不支持思考型不支持网址上下文不支持
使用选项	批量 API 支持灵活推理不支持优先推理不支持
版本	如需了解详情，请参阅模型版本模式。 `gemini-2.5-pro-preview-tts`
最后更新时间	2025 年 12 月