模型


Gemini 3


Gemini 2.5 Flash

Gemini 2.5 Flash

在性价比方面表现出色的模型,适合需要推理的低延迟、高数据量任务。

Nano Banana

先进的原生图片生成和编辑功能,旨在实现快速创意工作流。

Gemini 2.5 Flash Live 预览版

经过优化,可用于亚秒级原生音频流式传输的实时对话代理。

Gemini 2.5 Flash TTS 预览版

可控的文字转语音音频生成,可精细控制风格和语速。


Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite

2.5 系列中最快、最经济实惠的多模态模型。


Gemini 2.5 Pro

Gemini 2.5 Pro

我们最先进的模型,可用于处理复杂任务,具有深度推理和编码能力。

Gemini 2.5 Pro TTS 预览版

高保真语音合成,针对播客和有声读物等结构化工作流程中的质量进行了优化。


音频模型

此部分包含所有音频模型,包括可能已在其他部分列出的模型

Gemini 2.5 Flash Live 预览版

我们的旗舰版 Live API 模型,可用于构建低延迟的双向语音和视频代理,并支持原生音频推理。

Gemini 2.5 Flash TTS 预览版

快速且可控的文字转语音功能,适用于低延迟、经济实惠的应用和实时助理。

Gemini 2.5 Pro TTS 预览版

高保真语音合成,针对播客和有声读物等结构化工作流程中的质量进行了优化。

Lyria 实验版

高保真音乐生成模型,可对乐器、BPM 和复杂乐曲进行精细的创作控制。


生成式媒体模型

此部分包含所有生成式媒体模型,包括可能已在其他部分列出的模型

Veo 3.1 预览版

先进的电影级视频生成功能,可实现高级创意控制和原生同步音频。

Nano Banana Pro 预览版

一款专业的设计引擎,具有推理核心,可实现录音室品质的 4K 视觉效果、复杂的布局和精准的文字渲染。

Nano Banana

先进的原生图片生成和编辑功能,旨在实现快速创意工作流。

Lyria 实验版

高保真音乐生成模型,可对乐器、BPM 和复杂乐曲进行精细的创作控制。

Imagen 4

文生图模型,具有快速和超快速生成功能,清晰度高达 2K 分辨率。


工具和代理模型

计算机使用情况预览版

一种可以“看到”数字屏幕并执行点击、输入和导航等界面操作的专用模型,可用于自动执行复杂的浏览器任务。

Gemini Deep Research 预览版

一种智能体模型,可自主规划和执行多步研究,从数百个来源中获取信息,并生成包含引用来源的交互式报告。


专用任务模型

Gemini Embeddings

用于高级语义搜索、文本分类和 RAG 系统的高维向量表示法。

Gemini Robotics 预览版

一种先进的具身推理模型,可理解物理空间并为机器人代理规划多步任务。


之前的模型

Gemini 2.0 Flash 已弃用

我们的第二代主力模型,具备新一代特性和改进功能,包括卓越的速度、原生工具使用和 100 万个 token 的上下文窗口。

Gemini 2.0 Flash-Lite 已弃用

Google 旗下的一款第二代模型,在速度方面表现出色,在成本效益和低延迟方面经过专门优化。


模型版本名称模式

Gemini 模型有稳定版预览版最新版实验版

稳定

指向特定的稳定模型。稳定版模型通常不会发生变化。大多数正式版应用都应使用特定的稳定模型。

例如:gemini-2.5-flash

预览

指向可用于生产的预览版模型。预览版模型通常会启用结算功能,可能具有更严格的速率限制,并且会在至少提前 2 周通知的情况下被弃用。

例如:gemini-2.5-flash-preview-09-2025

最新

指向特定型号变体的最新版本。可以是稳定版、预览版或实验版。此别名将随着特定型号变体的每次新发布而进行热交换。在更改为落后于最新版本的版本之前,我们会通过电子邮件提前 2 周通知您。

例如:gemini-flash-latest

实验性

指向实验性模型,该模型通常不适合用于生产环境,并且具有更严格的速率限制。我们会发布实验性模型,以便收集反馈并快速将最新更新提供给开发者。

实验性模型不稳定,模型端点的可用性可能会发生变化。

模型弃用

如需了解模型弃用信息,请访问 Gemini 弃用页面。