Gemini 3.1 Flash TTS(文字转语音)预览版

Gemini 3.1 Flash TTS 预览版模型提供强大的低延迟语音生成功能,具有自然输出、可控提示和新的表现力音频标记,可实现精确的旁白控制。

文档

Gemini 3.1 Flash TTS 预览版模型引入了用于控制旁白的表现力 音频标记 ,并全面改进了自然度、 可控性和多语言支持。

如需全面了解各项功能,请访问文字转语音指南。

gemini-3.1-flash-tts-preview

属性 说明
模型代码 gemini-3.1-flash-tts-preview
支持的数据类型

输入源

文本

输出

音频

Token 限制[*]

输入 token 限制

8192

输出 token 限制

16384

功能

音频生成

支持

批量 API

支持

缓存

不支持

代码执行

不支持

文件搜索

不支持

函数调用

不支持

Grounding with Google Maps

不支持

图片生成

不支持

Live API

不支持

搜索接地

不支持

结构化输出

不支持

思考型

不支持

网址上下文

不支持

版本
如需了解详情,请参阅模型版本模式
  • gemini-3.1-flash-tts-preview
最新更新 2026 年 4 月
知识截点 2025 年 1 月