Interactions API 现已正式发布。我们建议使用此 API 来访问所有最新功能和模型。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

模型

Gemini 3

稳定版

Gemini 3.5 Flash

最智能的模型，可在智能体和编码任务中持续提供前沿性能。

稳定版

Gemini 3.1 Flash-Lite

前沿级性能，可与大型模型相媲美，但成本却低得多。

稳定版

Nano Banana 2

功能强大、高效的图片生成和编辑，针对速度和高调用量场景进行了优化。

稳定版

Nano Banana 2 Lite

超低延迟且经济实惠的图片生成和编辑，专为高调用量互动场景而设计。

稳定版

Nano Banana Pro

先进的图片生成和编辑模型，可用于高度情境化的原生图片创作。

稳定版

预览版

Gemini 3.1 Pro

具备先进的智能、复杂的问题解决能力，以及强大的智能体和 vibe 编码能力。

预览版

Gemini 3 Flash

前沿级性能，可与大型模型相媲美，但成本却低得多。

预览版

Gemini 3.5 Live Translate

低延迟的实时语音翻译模型，支持 70 多种语言。

新预览版

Gemini 3.1 Flash Live

高质量、低延迟的 Live API 模型，适用于实时对话和语音优先的 AI 应用。

新预览版

Gemini 3.1 Flash TTS

功能强大、低延迟的语音生成。

新预览版

Gemini Omni Flash

快速的对话式视频生成和编辑。将文本和图片转换为视频，并通过自然语言优化结果。

新预览版

Gemini 2.5 Flash

Google 旗下性价比最高的模型，适用于需要推理的低延迟、高调用量任务。

Nano Banana

先进的原生图片生成和编辑，专为快速创意工作流而设计。

Gemini 2.5 Flash Live 预览版

针对实时对话智能体进行了优化，可实现亚秒级原生音频流式传输。

Gemini 2.5 Flash TTS 预览版

可控的文字转语音音频生成，可精细控制样式和语速。

Gemini 2.5 Flash-Lite

2.5 系列中最快、最具预算效益的多模态模型。

Gemini 2.5 Pro

Google 旗下最先进的模型，适用于复杂任务，具有深度推理和编码能力。

Gemini 2.5 Pro TTS 预览版

高保真语音合成，针对播客和有声读物等结构化工作流的质量进行了优化。

音频模型

本部分包含所有音频模型，包括可能已在其他部分列出的模型

Gemini 3.1 Flash Live 预览版

Google 旗下高质量、低延迟的音频转音频 (A2A) 模型，专为实时对话和语音优先的 AI 应用而设计。

Gemini 3.1 Flash TTS 预览版

功能强大、低延迟的语音生成，具有自然输出、可引导的提示，以及用于精确旁白控制的新表现力音频标记。

Gemini 2.5 Flash Live 预览版

Google 旗下的旗舰 Live API 模型，适用于低延迟、双向语音和视频智能体，具有原生音频推理能力。

Gemini 2.5 Flash TTS 预览版

快速且可控的文字转语音，适用于低延迟、经济实惠的应用和实时助理。

Gemini 2.5 Pro TTS 预览版

高保真语音合成，针对播客和有声读物等结构化工作流的质量进行了优化。

生成式媒体模型

本部分包含所有生成式媒体模型，包括可能已在其他部分列出的模型

Nano Banana 2

高效的生产级视觉内容创作，将 Gemini 3 系列的智能与闪电般快速的生成速度相结合。

Nano Banana 2 Lite

专为图片生成系列中的效率专家而设计，提供超低延迟且经济实惠的图片生成和编辑。

Veo 3.1 预览版

先进的电影级视频生成，具有高级创意控制和原生同步音频。

Nano Banana Pro

专业的设计引擎，具有推理核心，可用于生成工作室品质的 4K 视觉内容、复杂的布局和精确的文本渲染。

Veo 3.1 Lite 预览版

Veo 3.1 系列提供高效、低成本、开发者优先的视频生成、编辑和电影级控制。

Gemini Omni Flash 预览版

快速的对话式视频生成和编辑。将文本和图片转换为视频，并通过自然语言优化结果。

Nano Banana

先进的原生图片生成和编辑，专为快速创意工作流而设计。

Imagen 4 已弃用

文生图模型，具有快速和超快速生成功能，以及高达 2K 分辨率的出色清晰度。

音乐生成模型

本部分包含所有音乐生成模型，包括可能已在其他部分列出的模型

Lyria 3 Pro 预览版

Google 旗下的旗舰音乐生成模型，针对具有复杂结构连贯性的完整歌曲进行了优化。

Lyria 3 Clip 预览版

针对生成短音乐片段、循环和预览（最长 30 秒）进行了优化。

Lyria RealTime 实验版

高保真音乐生成模型，提供精细的创意控制和实时流式传输功能。

工具和智能体模型

Computer Use 预览版

一种专用模型，可以“看到”数字屏幕并执行点击、输入和导航等界面操作，以自动执行复杂的浏览器任务。

Gemini Deep Research 预览版

一种智能体模型，可自主规划和执行跨数百个来源的多步研究，以生成注明引用来源的互动报告。

Gemini Deep Research Max 预览版

在数百个来源中自动收集和整合上下文，实现最大程度的全面性。

Antigravity 智能体预览版

一种通用型托管智能体，可在安全、隔离的 Linux 沙盒中自主规划、推理、运行代码、管理文件和浏览网页。

专用任务模型

Gemini Embedding 2

Google 旗下的首款多模态嵌入模型，可将文本、图片、视频、音频和 PDF 映射到统一的嵌入空间中，以用于高级语义搜索和 RAG 系统。

Gemini Embedding

高维向量表示法，适用于高级语义搜索、文本分类和 RAG 系统。

Gemini Robotics-ER 1.6预览版

先进的具身推理模型，可理解物理空间并为机器人智能体规划多步任务，具有仪器读取、改进的空间和物理推理等新功能。

之前的模型

Gemini 2.0 Flash 关闭

Google 旗下的第二代主力模型，具有新一代功能和改进的功能，包括卓越的速度、原生工具使用和 100 万个 token 的上下文窗口。

Gemini 2.0 Flash-Lite 关闭

Google 旗下速度最快的第二代模型，针对成本效益和低延迟进行了优化。

Gemini 3.1 Flash-Lite 预览版关闭

Google 旗下最具成本效益的多模态模型，可为高频、轻量级任务提供最快的性能。

Gemini 3 Pro 预览版关闭

Google 旗下先进的推理模型，具有高级多模态理解能力。

模型版本名称模式

Gemini 模型提供 稳定版 、 预览版 、 最新版 或 实验版 。

稳定版

指向特定的稳定模型。稳定模型通常不会更改。大多数生产应用都应使用特定的稳定模型。

例如：gemini-3.5-flash。

预览版

指向可用于生产的预览模型。预览模型通常会启用结算功能，可能具有更严格的速率限制，并且会在至少提前 2 周收到通知后被弃用。

例如：gemini-2.5-flash-preview-09-2025。

实验版

指向实验模型，该模型通常不适合用于生产，并且具有更严格的速率限制。我们发布实验模型是为了收集反馈，并让开发者快速获得我们的最新更新。

实验模型不稳定，模型端点的可用性可能会发生变化。

模型弃用

如需了解模型弃用，请访问 Gemini 弃用页面。