Interactions API 现已正式发布。我们建议使用此 API 来访问所有最新功能和模型。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini 3.1 Flash TTS（文字转语音）预览版

Gemini 3.1 Flash TTS 预览版模型提供强大的低延迟语音生成功能，具有自然输出、可控提示和新的表现力音频标记，可实现精确的旁白控制。

文档

Gemini 3.1 Flash TTS 预览版模型引入了用于控制旁白的表现力音频标记，并全面改进了自然度、可控性和多语言支持。

如需全面了解各项功能，请访问文字转语音指南。

属性	说明
模型代码	`gemini-3.1-flash-tts-preview`
支持的数据类型	输入源文本输出音频
Token 限制^[*]	输入 token 限制 8192 输出 token 限制 16384
功能	音频生成支持批量 API 支持缓存不支持代码执行不支持文件搜索不支持函数调用不支持 Grounding with Google Maps 不支持图片生成不支持 Live API 不支持搜索接地不支持结构化输出不支持思考型不支持网址上下文不支持
版本	如需了解详情，请参阅模型版本模式。 `gemini-3.1-flash-tts-preview`
最新更新	2026 年 4 月
知识截点	2025 年 1 月