Gemini 3
Gemini 3 Pro
我们最智能的模型,也是全球领先的多模态理解模型,建立在先进的推理技术基础上。
预览
Gemini 3 Flash
以更低的成本实现可与大型模型相媲美的 Frontier 级性能。
预览
Nano Banana Pro
先进的图片生成和编辑模型,可根据具体情境创建原生图片。
预览
Gemini 2.5 Flash
Gemini 2.5 Flash
在性价比方面表现出色的模型,适合需要推理的低延迟、高数据量任务。
Nano Banana
先进的原生图片生成和编辑功能,旨在实现快速创意工作流。
Gemini 2.5 Flash Live 预览版
经过优化,可用于亚秒级原生音频流式传输的实时对话代理。
Gemini 2.5 Flash TTS 预览版
可控的文字转语音音频生成,可精细控制风格和语速。
Gemini 2.5 Flash-Lite
Gemini 2.5 Flash-Lite
2.5 系列中最快、最经济实惠的多模态模型。
Gemini 2.5 Pro
Gemini 2.5 Pro
我们最先进的模型,可用于处理复杂任务,具有深度推理和编码能力。
Gemini 2.5 Pro TTS 预览版
高保真语音合成,针对播客和有声读物等结构化工作流程中的质量进行了优化。
音频模型
此部分包含所有音频模型,包括可能已在其他部分列出的模型
Gemini 2.5 Flash Live 预览版
我们的旗舰版 Live API 模型,可用于构建低延迟的双向语音和视频代理,并支持原生音频推理。
Gemini 2.5 Flash TTS 预览版
快速且可控的文字转语音功能,适用于低延迟、经济实惠的应用和实时助理。
Gemini 2.5 Pro TTS 预览版
高保真语音合成,针对播客和有声读物等结构化工作流程中的质量进行了优化。
Lyria 实验版
高保真音乐生成模型,可对乐器、BPM 和复杂乐曲进行精细的创作控制。
生成式媒体模型
此部分包含所有生成式媒体模型,包括可能已在其他部分列出的模型
Veo 3.1 预览版
先进的电影级视频生成功能,可实现高级创意控制和原生同步音频。
Nano Banana Pro 预览版
一款专业的设计引擎,具有推理核心,可实现录音室品质的 4K 视觉效果、复杂的布局和精准的文字渲染。
Nano Banana
先进的原生图片生成和编辑功能,旨在实现快速创意工作流。
Lyria 实验版
高保真音乐生成模型,可对乐器、BPM 和复杂乐曲进行精细的创作控制。
Imagen 4
文生图模型,具有快速和超快速生成功能,清晰度高达 2K 分辨率。
工具和代理模型
计算机使用情况预览版
一种可以“看到”数字屏幕并执行点击、输入和导航等界面操作的专用模型,可用于自动执行复杂的浏览器任务。
Gemini Deep Research 预览版
一种智能体模型,可自主规划和执行多步研究,从数百个来源中获取信息,并生成包含引用来源的交互式报告。
专用任务模型
Gemini Embeddings
用于高级语义搜索、文本分类和 RAG 系统的高维向量表示法。
Gemini Robotics 预览版
一种先进的具身推理模型,可理解物理空间并为机器人代理规划多步任务。
之前的模型
Gemini 2.0 Flash 已弃用
我们的第二代主力模型,具备新一代特性和改进功能,包括卓越的速度、原生工具使用和 100 万个 token 的上下文窗口。
Gemini 2.0 Flash-Lite 已弃用
Google 旗下的一款第二代模型,在速度方面表现出色,在成本效益和低延迟方面经过专门优化。
模型版本名称模式
Gemini 模型有稳定版、预览版、最新版或实验版。
稳定
指向特定的稳定模型。稳定版模型通常不会发生变化。大多数正式版应用都应使用特定的稳定模型。
例如:gemini-2.5-flash。
预览
指向可用于生产的预览版模型。预览版模型通常会启用结算功能,可能具有更严格的速率限制,并且会在至少提前 2 周通知的情况下被弃用。
例如:gemini-2.5-flash-preview-09-2025。
最新
指向特定型号变体的最新版本。可以是稳定版、预览版或实验版。此别名将随着特定型号变体的每次新发布而进行热交换。在更改为落后于最新版本的版本之前,我们会通过电子邮件提前 2 周通知您。
例如:gemini-flash-latest。
实验性
指向实验性模型,该模型通常不适合用于生产环境,并且具有更严格的速率限制。我们会发布实验性模型,以便收集反馈并快速将最新更新提供给开发者。
实验性模型不稳定,模型端点的可用性可能会发生变化。
模型弃用
如需了解模型弃用信息,请访问 Gemini 弃用页面。