本页面记录了 Gemini API 的更新。
2025 年 7 月 17 日
Veo 于
veo-3.0-generate-preview
发布了最新更新,新增了生成带音频的视频的功能。如需详细了解 Veo 3,请访问型号页面。提高了 Imagen 4 Standard 和 Ultra 的速率限制。如需了解详情,请访问速率限制页面。
2025 年 7 月 14 日
- 发布了文本嵌入模型的稳定版
gemini-embedding-001
。如需了解详情,请参阅嵌入。gemini-embedding-exp-03-07
型号将于 2025 年 8 月 14 日弃用。
2025 年 7 月 7 日
- 推出了 Gemini API 批处理模式。将请求分批发送,并以异步方式处理。如需了解详情,请参阅批量模式。
2025 年 6 月 26 日
预览版模型
gemini-2.5-pro-preview-05-06
和gemini-2.5-pro-preview-03-25
现在会重定向到最新的稳定版gemini-2.5-pro
。gemini-2.5-pro-exp-03-25
已弃用。
2025 年 6 月 24 日
- 发布了 Imagen 4 Ultra 和标准预览模型。如需了解详情,请参阅图片生成页面。
2025 年 6 月 17 日
- 发布了
gemini-2.5-pro
,这是我们功能最强大的模型的稳定版,现在还具备自适应思维能力。如需了解详情,请参阅 Gemini 2.5 Pro 和思考。gemini-2.5-pro-preview-05-06
将于 2025 年 6 月 26 日重定向到gemini-2.5-pro
。 - 发布了首个稳定版 2.5 Flash 模型
gemini-2.5-flash
。如需了解详情,请参阅 Gemini 2.5 Flash。gemini-2.5-flash-preview-04-17
将于 2025 年 7 月 15 日弃用。 - 发布了
gemini-2.5-flash-lite-preview-06-17
,这是一款低成本、高性能的 Gemini 2.5 模型。如需了解详情,请参阅 Gemini 2.5 Flash-Lite 预览版。
2025 年 6 月 5 日
- 发布了
gemini-2.5-pro-preview-06-05
,这是我们最强大的模型的新版本,现在具有自适应思维能力。如需了解详情,请参阅 Gemini 2.5 Pro 预览版和思考。gemini-2.5-pro-preview-05-06
将于 2025 年 6 月 26 日重定向到gemini-2.5-pro
。
2025 年 5 月 20 日
API 更新:
- 推出了对自定义视频预处理的支持,可使用剪辑间隔和可配置的帧速率采样。
- 推出了多工具使用功能,支持在同一
generateContent
请求中配置代码执行和基于 Google 搜索的 Grounding。 - 在 Live API 中推出了对异步函数调用的支持。
- 推出了实验性 网址 上下文工具,用于提供网址作为提示的额外上下文。
模型更新:
- 发布了
gemini-2.5-flash-preview-05-20
,这是一款经过优化的 Gemini 预览版模型,具有出色的性价比和自适应思维能力。如需了解详情,请参阅 Gemini 2.5 Flash 预览版和思考。 - 发布了
gemini-2.5-pro-preview-tts
和gemini-2.5-flash-preview-tts
模型,这些模型能够生成单人或双人语音。 - 发布了
lyria-realtime-exp
模型,该模型可实时生成音乐。 - 发布了
gemini-2.5-flash-preview-native-audio-dialog
和gemini-2.5-flash-exp-native-audio-thinking-dialog
,这是适用于 Live API 的新 Gemini 模型,具有原生音频输出功能。如需了解详情,请参阅 Live API 指南和 Gemini 2.5 Flash 原生音频。 - 发布了
gemma-3n-e4b-it
预览版,可在 AI Studio 中使用,也可通过 Gemini API 使用,是 Gemma 3n 发布的一部分。
2025 年 5 月 7 日
- 发布了
gemini-2.0-flash-preview-image-generation
,这是一个用于生成和修改图片的预览模型。如需了解详情,请参阅图片生成和 Gemini 2.0 Flash 预览版图片生成。
2025 年 5 月 6 日
- 发布了
gemini-2.5-pro-preview-05-06
,这是我们功能最强大的模型的新版本,在代码和函数调用方面有所改进。gemini-2.5-pro-preview-03-25
将自动指向新版模型。
2025 年 4 月 17 日
- 发布了
gemini-2.5-flash-preview-04-17
,这是一款经过优化的 Gemini 预览版模型,具有出色的性价比和自适应思维能力。如需了解详情,请参阅 Gemini 2.5 Flash 预览版和思考。
2025 年 4 月 16 日
- 为 Gemini 2.0 Flash 推出了上下文缓存功能。
2025 年 4 月 9 日
模型更新:
- 发布了
veo-2.0-generate-001
,一款正式版 (GA) 的文本到视频和图片到视频模型,能够生成细节丰富且富有艺术性的视频。如需了解详情,请参阅 Veo 文档。 发布了
gemini-2.0-flash-live-001
,即启用了结算功能的 Live API 模型的公开预览版。增强了会话管理和可靠性
- 会话恢复:在临时网络中断期间保持会话有效。该 API 现在支持服务器端会话状态存储(最长 24 小时),并提供用于重新连接和从上次中断处继续的句柄 (session_resumption)。
- 通过上下文压缩实现更长的会话:支持超出之前时间限制的扩展互动。配置使用滑动窗口机制的上下文窗口压缩,以自动管理上下文长度,防止因上下文限制而突然终止。
- 正常断开连接通知:接收
GoAway
服务器消息,指示连接即将关闭,以便在终止之前进行正常处理。
更好地控制互动动态
可配置的语音活动检测 (VAD):选择灵敏度级别,或完全停用自动 VAD,并使用新的客户端事件(
activityStart
、activityEnd
)进行手动轮流控制。可配置的中断处理:决定用户输入是否应中断模型的回答。
可配置的轮流覆盖范围:选择 API 是持续处理所有音频和视频输入,还是仅在检测到最终用户说话时捕获音频和视频输入。
可配置的媒体分辨率:通过选择输入媒体的分辨率,优化质量或令牌使用情况。
更丰富的输出内容和功能
扩展的语音和语言选项:您可以选择两种新语音和 30 种新语言作为音频输出。现在,您可以在
speechConfig
中配置输出语言。文本流式传输:以增量方式接收生成的文本回答,从而更快地向用户显示回答。
令牌使用情况报告:通过服务器消息的
usageMetadata
字段中提供的详细令牌数量(按模态和提示或回答阶段细分)深入了解使用情况。
2025 年 4 月 4 日
- 发布了
gemini-2.5-pro-preview-03-25
,一个已启用结算功能的公开预览版 Gemini 2.5 Pro 版本。您可以继续在免费层级中使用gemini-2.5-pro-exp-03-25
。
2025 年 3 月 25 日
- 发布了
gemini-2.5-pro-exp-03-25
,这是一款公开实验版 Gemini 模型,默认情况下始终处于思考模式。 如需了解详情,请参阅 Gemini 2.5 Pro Experimental。
2025 年 3 月 12 日
模型更新:
- 发布了实验版 Gemini 2.0 Flash 模型,该模型能够生成和修改图片。
- 已于
gemma-3-27b-it
发布,作为 Gemma 3 发布的一部分,可在 AI Studio 中使用,也可通过 Gemini API 使用。
API 更新:
- 新增了对 YouTube 网址作为媒体来源的支持。
- 添加了对包含小于 20MB 的内嵌视频的支持。
2025 年 3 月 11 日
SDK 更新:
- 面向公众发布了 Google Gen AI SDK for TypeScript and JavaScript 的公开预览版。
2025 年 3 月 7 日
模型更新:
- 发布了
gemini-embedding-exp-03-07
,一款基于 Gemini 的实验性嵌入模型,目前处于公开预览版阶段。
2025 年 2 月 28 日
API 更新:
- 为基于 Gemini 2.0 Pro 的实验性模型
gemini-2.0-pro-exp-02-05
添加了对将搜索作为工具的支持。
2025 年 2 月 25 日
模型更新:
- 发布了
gemini-2.0-flash-lite
,即 Gemini 2.0 Flash-Lite 的正式版 (GA),该模型经过优化,可实现出色的速度、规模和成本效益。
2025 年 2 月 19 日
AI Studio 更新:
- 支持其他地区(科索沃、格陵兰和法罗群岛)。
API 更新:
- 支持其他地区(科索沃、格陵兰和法罗群岛)。
2025 年 2 月 18 日
模型更新:
- Gemini 1.0 Pro 不再受支持。如需查看支持的型号列表,请参阅 Gemini 模型。
2025 年 2 月 11 日
API 更新:
- 更新了 OpenAI 库的兼容性。
2025 年 2 月 6 日
模型更新:
- 发布了
imagen-3.0-generate-002
,即 Gemini API 中的 Imagen 3 的正式版 (GA)。
SDK 更新:
- 发布了 Google Gen AI SDK for Java 公开预览版。
2025 年 2 月 5 日
模型更新:
- 发布了
gemini-2.0-flash-001
,这是 Gemini 2.0 Flash 的正式版 (GA),仅支持文本输出。 - 发布了
gemini-2.0-pro-exp-02-05
,即 Gemini 2.0 Pro 的实验性公开预览版。 - 发布了
gemini-2.0-flash-lite-preview-02-05
,这是一个针对成本效益进行优化的实验性公开预览版模型。
API 更新:
- 为代码执行添加了文件输入和图表输出支持。
SDK 更新:
- 发布了 Google Gen AI SDK for Python 正式版 (GA)。
2025 年 1 月 21 日
模型更新:
- 发布了
gemini-2.0-flash-thinking-exp-01-21
,即 Gemini 2.0 Flash Thinking 模型背后的最新预览版模型。
2024 年 12 月 19 日
模型更新:
发布了 Gemini 2.0 Flash Thinking 模式的公开预览版。思考模式是一种测试时间计算模型,可让您在模型生成回答时查看其思考过程,并生成推理能力更强的回答。
如需详细了解 Gemini 2.0 Flash Thinking 模式,请参阅我们的概览页面。
2024 年 12 月 11 日
模型更新:
- 发布了 Gemini 2.0 Flash Experimental 的公开预览版。Gemini 2.0 Flash Experimental 的部分功能包括:
- 速度是 Gemini 1.5 Pro 的两倍
- 使用 Live API 进行双向流式传输
- 以文本、图片和语音形式生成多模态回答
- 内置工具使用功能,支持多轮推理,可使用代码执行、搜索、函数调用等功能
如需详细了解 Gemini 2.0 Flash,请参阅我们的概览页面。
2024 年 11 月 21 日
模型更新:
- 发布了
gemini-exp-1121
,一款功能更强大的实验性 Gemini API 模型。
模型更新:
- 更新了
gemini-1.5-flash-latest
和gemini-1.5-flash
模型别名,以使用gemini-1.5-flash-002
。- 更改为
top_k
参数:gemini-1.5-flash-002
模型支持介于 1 和 41(不含)之间的top_k
值。大于 40 的值将更改为 40。
- 更改为
2024 年 11 月 14 日
模型更新:
- 发布了
gemini-exp-1114
,这是一款强大的实验性 Gemini API 模型。
2024 年 11 月 8 日
API 更新:
- 在 OpenAI 库 / REST API 中添加了对 Gemini 的支持。
2024 年 10 月 31 日
API 更新:
2024 年 10 月 3 日
模型更新:
- 发布了
gemini-1.5-flash-8b-001
,这是我们最小的 Gemini API 模型稳定版。
2024 年 9 月 24 日
模型更新:
- 发布了
gemini-1.5-pro-002
和gemini-1.5-flash-002
,这是 Gemini 1.5 Pro 和 1.5 Flash 的两个全新稳定版,已正式发布。 - 更新了
gemini-1.5-pro-latest
模型代码以使用gemini-1.5-pro-002
,并更新了gemini-1.5-flash-latest
模型代码以使用gemini-1.5-flash-002
。 - 发布了
gemini-1.5-flash-8b-exp-0924
以取代gemini-1.5-flash-8b-exp-0827
。 - 为 Gemini API 和 AI Studio 发布了公民诚信安全过滤器。
- 在 Python 和 NodeJS 中为 Gemini 1.5 Pro 和 1.5 Flash 发布了对两个新参数的支持:
frequencyPenalty
和presencePenalty
。
2024 年 9 月 19 日
AI Studio 更新:
- 在模型回答中添加了“喜欢”和“不喜欢”按钮,以便用户针对回答质量提供反馈。
API 更新:
- 新增了对 Google Cloud 赠金的支持,现在可将 Google Cloud 赠金用于 Gemini API 用量。
2024 年 9 月 17 日
AI Studio 更新:
- 添加了在 Colab 中打开按钮,可将提示以及运行提示所需的代码导出到 Colab 笔记本。该功能尚不支持使用工具(JSON 模式、函数调用或代码执行)进行提示。
2024 年 9 月 13 日
AI Studio 更新:
- 新增了对比较模式的支持,可让您比较不同模型和提示的回答,以便找到最适合您应用场景的回答。
2024 年 8 月 30 日
模型更新:
- Gemini 1.5 Flash 支持通过模型配置提供 JSON 架构。
2024 年 8 月 27 日
模型更新:
- 发布了以下实验性模型:
gemini-1.5-pro-exp-0827
gemini-1.5-flash-exp-0827
gemini-1.5-flash-8b-exp-0827
2024 年 8 月 9 日
API 更新:
- 添加了对 PDF 处理的支持。
2024 年 8 月 5 日
模型更新:
- 发布了对 Gemini 1.5 Flash 的微调支持。
2024 年 8 月 1 日
模型更新:
- 发布了
gemini-1.5-pro-exp-0801
,即 Gemini 1.5 Pro 的新实验版。
2024 年 7 月 12 日
模型更新:
- 从 Google AI 服务和工具中移除了对 Gemini 1.0 Pro Vision 的支持。
2024 年 6 月 27 日
模型更新:
- 正式发布 Gemini 1.5 Pro 的 200 万上下文窗口。
API 更新:
- 新增了对代码执行的支持。
2024 年 6 月 18 日
API 更新:
- 添加了对上下文缓存的支持。
2024 年 6 月 12 日
模型更新:
- Gemini 1.0 Pro Vision 已弃用。
2024 年 5 月 23 日
模型更新:
- Gemini 1.5 Pro (
gemini-1.5-pro-001
) 已发布正式版 (GA)。 - Gemini 1.5 Flash (
gemini-1.5-flash-001
) 正式发布 (GA)。
2024 年 5 月 14 日
API 更新:
- 为 Gemini 1.5 Pro 推出了 200 万个 token 的上下文窗口(等候名单)。
- 为 Gemini 1.0 Pro 推出了“随用随付”结算方式,Gemini 1.5 Pro 和 Gemini 1.5 Flash 的结算方式即将推出。
- 为即将推出的 Gemini 1.5 Pro 付费层级提高了速率限制。
- 向 File API 添加了内置视频支持。
- 为 File API 添加了纯文本支持。
- 添加了对并行函数调用的支持,以便一次返回多个调用结果。
2024 年 5 月 10 日
模型更新:
- 发布了预览版 Gemini 1.5 Flash (
gemini-1.5-flash-latest
)。
2024 年 4 月 9 日
模型更新:
- 发布了预览版 Gemini 1.5 Pro (
gemini-1.5-pro-latest
)。 - 发布了新的文本嵌入模型
text-embeddings-004
,该模型支持小于 768 的弹性嵌入大小。
API 更新:
- 发布了 File API,用于临时存储媒体文件以用于提示。
- 新增了对使用文本、图片和音频数据(也称为多模态)提示的支持。如需了解详情,请参阅使用媒体内容进行提示。
- 在 Beta 版中发布了系统指令。
- 添加了函数调用模式,用于定义函数调用的执行行为。
- 新增了对
response_mime_type
配置选项的支持,该选项可让您请求 JSON 格式的响应。
2024 年 3 月 19 日
模型更新:
- 新增了对在 Google AI Studio 中或通过 Gemini API 调优 Gemini 1.0 Pro 的支持。
2023 年 12 月 13 日
模型更新:
- gemini-pro:适用于各种任务的新文本模型。平衡功能和效率。
- gemini-pro-vision:适用于各种任务的新多模态模型。 兼具功能和效率。
- embedding-001:新的嵌入模型。
- aqa:一种经过专门调优的新模型,经过训练,可使用文本段落作为依据来回答问题。
如需了解详情,请参阅 Gemini 模型。
API 版本更新:
- v1:稳定版 API 渠道。
- v1beta:Beta 版。此频道具有可能正在开发中的功能。
如需了解详情,请参阅“API 版本”主题。
API 更新:
GenerateContent
是用于聊天和文本的单个统一端点。- 通过
StreamGenerateContent
方法提供流式传输。 - 多模态功能:图片是一种新支持的模态
- 新增了 Beta 版功能:
- 函数调用
- Semantic Retriever
- 归因式问答 (AQA)
- 更新了候选回答数量:Gemini 模型仅返回 1 个候选回答。
- 不同的安全设置和 SafetyRating 类别。如需了解详情,请参阅安全设置。
- 目前尚不支持对 Gemini 模型进行调参(正在开发中)。