Gemini 3.1 Flash TTS 预览版模型可提供强大的低延迟语音生成功能,输出自然,提示可控,并提供新的富有表现力的音频标记,可实现精准的旁白控制。
文档
Gemini 3.1 Flash TTS 预览版模型引入了用于控制旁白的富有表现力的音频标记,并全面提升了自然度、可控性和多语言能力。
如需全面了解功能和能力,请参阅 Text-to-Speech 指南。
gemini-3.1-flash-tts-preview
| 属性 | 说明 |
|---|---|
| 模型代码 | gemini-3.1-flash-tts-preview |
| 支持的数据类型 |
输入源 文本 输出 音频 |
| 令牌限制[*] |
输入 token 限制 8192 输出 token 限制 16384 |
| 功能 |
音频生成 支持 批量 API 支持 缓存 不受支持 代码执行 不受支持 文件搜索 不支持 函数调用 不受支持 依托 Google 地图进行接地 不受支持 图片生成 不受支持 Live API 不受支持 搜索接地 不受支持 结构化输出 不受支持 思考型 不受支持 网址上下文 不受支持 |
| 版本 |
|
| 最新更新 | 2026 年 4 月 |
| 知识截点 | 2025 年 1 月 |