Gemini 2.5 Pro Text-to-Speech

我们的优质引擎,可实现录音室品质的语音合成,提供高保真且精密的音频生成功能。Gemini 2.5 Pro TTS 最适合长篇内容、专业旁白和复杂的创意工作流,这些工作流需要最高水平的语音清晰度和自然的韵律。

文档

如需全面了解功能和能力,请参阅文本转语音指南。

gemini-2.5-pro-preview-tts

属性 说明
模型代码 gemini-2.5-pro-preview-tts
支持的数据类型

输入

文本

输出

音频

Token 限制[*]

输入 token 限制

8192

输出 token 限制

16384

功能

音频生成

支持

批量 API

支持

缓存

不支持

代码执行

不支持

文件搜索

不支持

函数调用

不支持

Grounding with Google Maps

不支持

图片生成

不支持

Live API

不支持

搜索接地

不支持

结构化输出

不支持

思考型

不支持

网址上下文

不支持

版本
如需了解详情,请参阅模型版本模式
  • gemini-2.5-pro-preview-tts
最后更新时间 2025 年 12 月