Gemini 3.5 实时翻译

Gemini 3.5 实时翻译是一款低延迟的音频转音频模型,经过优化,可实时翻译语音对话。它可实现无缝的双向翻译,准确度高,语音输出自然流畅。

文档

如需全面了解功能和特性,请参阅实时翻译指南。

gemini-3.5-live-translate-preview

属性 说明
模型代码 gemini-3.5-live-translate-preview
支持的数据类型

输入源

音频(语音)

输出

音频(翻译后的语音)和文本(转写内容)

令牌限制[*]

输入 token 限制

131,072

输出 token 限制

65536

功能

音频生成

支持

缓存

不受支持

代码执行

不受支持

文件搜索

不支持

函数调用

不支持

Grounding with Google Maps

不受支持

图片生成

不受支持

Live API

支持

搜索接地

不支持

结构化输出

不受支持

思考型

不受支持

网址上下文

不受支持

使用选项

Batch API

不受支持

灵活推理

不受支持

优先推断

不受支持

版本
如需了解详情,请参阅模型版本模式
  • 预览:gemini-3.5-live-translate-preview
最新更新 2026 年 6 月
知识截点 2025 年 1 月