版本说明

本页面记录了 Gemini API 的更新。

2025 年 7 月 17 日

  • Veo 于 veo-3.0-generate-preview 发布了最新更新,新增了生成带音频的视频的功能。如需详细了解 Veo 3,请访问型号页面。

  • 提高了 Imagen 4 Standard 和 Ultra 的速率限制。如需了解详情,请访问速率限制页面。

2025 年 7 月 14 日

  • 发布了文本嵌入模型的稳定版 gemini-embedding-001。如需了解详情,请参阅嵌入gemini-embedding-exp-03-07 型号将于 2025 年 8 月 14 日弃用。

2025 年 7 月 7 日

  • 推出了 Gemini API 批处理模式。将请求分批发送,并以异步方式处理。如需了解详情,请参阅批量模式

2025 年 6 月 26 日

  • 预览版模型 gemini-2.5-pro-preview-05-06gemini-2.5-pro-preview-03-25 现在会重定向到最新的稳定版 gemini-2.5-pro

  • gemini-2.5-pro-exp-03-25 已弃用。

2025 年 6 月 24 日

  • 发布了 Imagen 4 Ultra 和标准预览模型。如需了解详情,请参阅图片生成页面。

2025 年 6 月 17 日

  • 发布了 gemini-2.5-pro,这是我们功能最强大的模型的稳定版,现在还具备自适应思维能力。如需了解详情,请参阅 Gemini 2.5 Pro思考gemini-2.5-pro-preview-05-06将于 2025 年 6 月 26 日重定向到 gemini-2.5-pro
  • 发布了首个稳定版 2.5 Flash 模型 gemini-2.5-flash。如需了解详情,请参阅 Gemini 2.5 Flashgemini-2.5-flash-preview-04-17 将于 2025 年 7 月 15 日弃用。
  • 发布了 gemini-2.5-flash-lite-preview-06-17,这是一款低成本、高性能的 Gemini 2.5 模型。如需了解详情,请参阅 Gemini 2.5 Flash-Lite 预览版

2025 年 6 月 5 日

  • 发布了 gemini-2.5-pro-preview-06-05,这是我们最强大的模型的新版本,现在具有自适应思维能力。如需了解详情,请参阅 Gemini 2.5 Pro 预览版思考gemini-2.5-pro-preview-05-06 将于 2025 年 6 月 26 日重定向到 gemini-2.5-pro

2025 年 5 月 20 日

API 更新

模型更新

2025 年 5 月 7 日

2025 年 5 月 6 日

  • 发布了 gemini-2.5-pro-preview-05-06,这是我们功能最强大的模型的新版本,在代码和函数调用方面有所改进。gemini-2.5-pro-preview-03-25 将自动指向新版模型。

2025 年 4 月 17 日

  • 发布了 gemini-2.5-flash-preview-04-17,这是一款经过优化的 Gemini 预览版模型,具有出色的性价比和自适应思维能力。如需了解详情,请参阅 Gemini 2.5 Flash 预览版思考

2025 年 4 月 16 日

2025 年 4 月 9 日

模型更新

  • 发布了 veo-2.0-generate-001,一款正式版 (GA) 的文本到视频和图片到视频模型,能够生成细节丰富且富有艺术性的视频。如需了解详情,请参阅 Veo 文档
  • 发布了 gemini-2.0-flash-live-001,即启用了结算功能的 Live API 模型的公开预览版。

    • 增强了会话管理和可靠性

      • 会话恢复:在临时网络中断期间保持会话有效。该 API 现在支持服务器端会话状态存储(最长 24 小时),并提供用于重新连接和从上次中断处继续的句柄 (session_resumption)。
      • 通过上下文压缩实现更长的会话:支持超出之前时间限制的扩展互动。配置使用滑动窗口机制的上下文窗口压缩,以自动管理上下文长度,防止因上下文限制而突然终止。
      • 正常断开连接通知:接收 GoAway 服务器消息,指示连接即将关闭,以便在终止之前进行正常处理。
    • 更好地控制互动动态

    • 可配置的语音活动检测 (VAD):选择灵敏度级别,或完全停用自动 VAD,并使用新的客户端事件(activityStartactivityEnd)进行手动轮流控制。

    • 可配置的中断处理:决定用户输入是否应中断模型的回答。

    • 可配置的轮流覆盖范围:选择 API 是持续处理所有音频和视频输入,还是仅在检测到最终用户说话时捕获音频和视频输入。

    • 可配置的媒体分辨率:通过选择输入媒体的分辨率,优化质量或令牌使用情况。

    • 更丰富的输出内容和功能

    • 扩展的语音和语言选项:您可以选择两种新语音和 30 种新语言作为音频输出。现在,您可以在 speechConfig 中配置输出语言。

    • 文本流式传输:以增量方式接收生成的文本回答,从而更快地向用户显示回答。

    • 令牌使用情况报告:通过服务器消息的 usageMetadata 字段中提供的详细令牌数量(按模态和提示或回答阶段细分)深入了解使用情况。

2025 年 4 月 4 日

  • 发布了 gemini-2.5-pro-preview-03-25,一个已启用结算功能的公开预览版 Gemini 2.5 Pro 版本。您可以继续在免费层级中使用 gemini-2.5-pro-exp-03-25

2025 年 3 月 25 日

  • 发布了 gemini-2.5-pro-exp-03-25,这是一款公开实验版 Gemini 模型,默认情况下始终处于思考模式。 如需了解详情,请参阅 Gemini 2.5 Pro Experimental

2025 年 3 月 12 日

模型更新

  • 发布了实验版 Gemini 2.0 Flash 模型,该模型能够生成和修改图片。
  • 已于 gemma-3-27b-it 发布,作为 Gemma 3 发布的一部分,可在 AI Studio 中使用,也可通过 Gemini API 使用。

API 更新

2025 年 3 月 11 日

SDK 更新

2025 年 3 月 7 日

模型更新

  • 发布了 gemini-embedding-exp-03-07,一款基于 Gemini 的实验性嵌入模型,目前处于公开预览版阶段。

2025 年 2 月 28 日

API 更新

  • 为基于 Gemini 2.0 Pro 的实验性模型 gemini-2.0-pro-exp-02-05 添加了对将搜索作为工具的支持。

2025 年 2 月 25 日

模型更新

  • 发布了 gemini-2.0-flash-lite,即 Gemini 2.0 Flash-Lite 的正式版 (GA),该模型经过优化,可实现出色的速度、规模和成本效益。

2025 年 2 月 19 日

AI Studio 更新

  • 支持其他地区(科索沃、格陵兰和法罗群岛)。

API 更新

  • 支持其他地区(科索沃、格陵兰和法罗群岛)。

2025 年 2 月 18 日

模型更新

  • Gemini 1.0 Pro 不再受支持。如需查看支持的型号列表,请参阅 Gemini 模型

2025 年 2 月 11 日

API 更新

2025 年 2 月 6 日

模型更新

SDK 更新

2025 年 2 月 5 日

模型更新

  • 发布了 gemini-2.0-flash-001,这是 Gemini 2.0 Flash 的正式版 (GA),仅支持文本输出。
  • 发布了 gemini-2.0-pro-exp-02-05,即 Gemini 2.0 Pro 的实验性公开预览版。
  • 发布了 gemini-2.0-flash-lite-preview-02-05,这是一个针对成本效益进行优化的实验性公开预览版模型

API 更新

SDK 更新

2025 年 1 月 21 日

模型更新

2024 年 12 月 19 日

模型更新

  • 发布了 Gemini 2.0 Flash Thinking 模式的公开预览版。思考模式是一种测试时间计算模型,可让您在模型生成回答时查看其思考过程,并生成推理能力更强的回答。

    如需详细了解 Gemini 2.0 Flash Thinking 模式,请参阅我们的概览页面

2024 年 12 月 11 日

模型更新

  • 发布了 Gemini 2.0 Flash Experimental 的公开预览版。Gemini 2.0 Flash Experimental 的部分功能包括:
    • 速度是 Gemini 1.5 Pro 的两倍
    • 使用 Live API 进行双向流式传输
    • 以文本、图片和语音形式生成多模态回答
    • 内置工具使用功能,支持多轮推理,可使用代码执行、搜索、函数调用等功能

如需详细了解 Gemini 2.0 Flash,请参阅我们的概览页面

2024 年 11 月 21 日

模型更新

  • 发布了 gemini-exp-1121,一款功能更强大的实验性 Gemini API 模型。

模型更新

  • 更新了 gemini-1.5-flash-latestgemini-1.5-flash 模型别名,以使用 gemini-1.5-flash-002
    • 更改为 top_k 参数:gemini-1.5-flash-002 模型支持介于 1 和 41(不含)之间的 top_k 值。大于 40 的值将更改为 40。

2024 年 11 月 14 日

模型更新

  • 发布了 gemini-exp-1114,这是一款强大的实验性 Gemini API 模型。

2024 年 11 月 8 日

API 更新

2024 年 10 月 31 日

API 更新

2024 年 10 月 3 日

模型更新

  • 发布了 gemini-1.5-flash-8b-001,这是我们最小的 Gemini API 模型稳定版。

2024 年 9 月 24 日

模型更新

  • 发布了 gemini-1.5-pro-002gemini-1.5-flash-002,这是 Gemini 1.5 Pro 和 1.5 Flash 的两个全新稳定版,已正式发布。
  • 更新了 gemini-1.5-pro-latest 模型代码以使用 gemini-1.5-pro-002,并更新了 gemini-1.5-flash-latest 模型代码以使用 gemini-1.5-flash-002
  • 发布了 gemini-1.5-flash-8b-exp-0924 以取代 gemini-1.5-flash-8b-exp-0827
  • 为 Gemini API 和 AI Studio 发布了公民诚信安全过滤器
  • 在 Python 和 NodeJS 中为 Gemini 1.5 Pro 和 1.5 Flash 发布了对两个新参数的支持:frequencyPenaltypresencePenalty

2024 年 9 月 19 日

AI Studio 更新

  • 在模型回答中添加了“喜欢”和“不喜欢”按钮,以便用户针对回答质量提供反馈。

API 更新

  • 新增了对 Google Cloud 赠金的支持,现在可将 Google Cloud 赠金用于 Gemini API 用量。

2024 年 9 月 17 日

AI Studio 更新

  • 添加了在 Colab 中打开按钮,可将提示以及运行提示所需的代码导出到 Colab 笔记本。该功能尚不支持使用工具(JSON 模式、函数调用或代码执行)进行提示。

2024 年 9 月 13 日

AI Studio 更新

  • 新增了对比较模式的支持,可让您比较不同模型和提示的回答,以便找到最适合您应用场景的回答。

2024 年 8 月 30 日

模型更新

2024 年 8 月 27 日

模型更新

  • 发布了以下实验性模型
    • gemini-1.5-pro-exp-0827
    • gemini-1.5-flash-exp-0827
    • gemini-1.5-flash-8b-exp-0827

2024 年 8 月 9 日

API 更新

2024 年 8 月 5 日

模型更新

  • 发布了对 Gemini 1.5 Flash 的微调支持。

2024 年 8 月 1 日

模型更新

  • 发布了 gemini-1.5-pro-exp-0801,即 Gemini 1.5 Pro 的新实验版。

2024 年 7 月 12 日

模型更新

  • 从 Google AI 服务和工具中移除了对 Gemini 1.0 Pro Vision 的支持。

2024 年 6 月 27 日

模型更新

  • 正式发布 Gemini 1.5 Pro 的 200 万上下文窗口。

API 更新

2024 年 6 月 18 日

API 更新

2024 年 6 月 12 日

模型更新

  • Gemini 1.0 Pro Vision 已弃用。

2024 年 5 月 23 日

模型更新

2024 年 5 月 14 日

API 更新

  • 为 Gemini 1.5 Pro 推出了 200 万个 token 的上下文窗口(等候名单)。
  • 为 Gemini 1.0 Pro 推出了“随用随付”结算方式,Gemini 1.5 Pro 和 Gemini 1.5 Flash 的结算方式即将推出。
  • 为即将推出的 Gemini 1.5 Pro 付费层级提高了速率限制。
  • File API 添加了内置视频支持。
  • File API 添加了纯文本支持。
  • 添加了对并行函数调用的支持,以便一次返回多个调用结果。

2024 年 5 月 10 日

模型更新

2024 年 4 月 9 日

模型更新

API 更新

  • 发布了 File API,用于临时存储媒体文件以用于提示。
  • 新增了对使用文本、图片和音频数据(也称为多模态)提示的支持。如需了解详情,请参阅使用媒体内容进行提示
  • 在 Beta 版中发布了系统指令
  • 添加了函数调用模式,用于定义函数调用的执行行为。
  • 新增了对 response_mime_type 配置选项的支持,该选项可让您请求 JSON 格式的响应。

2024 年 3 月 19 日

模型更新

2023 年 12 月 13 日

模型更新

  • gemini-pro:适用于各种任务的新文本模型。平衡功能和效率。
  • gemini-pro-vision:适用于各种任务的新多模态模型。 兼具功能和效率。
  • embedding-001:新的嵌入模型。
  • aqa:一种经过专门调优的新模型,经过训练,可使用文本段落作为依据来回答问题。

如需了解详情,请参阅 Gemini 模型

API 版本更新

  • v1:稳定版 API 渠道。
  • v1beta:Beta 版。此频道具有可能正在开发中的功能。

如需了解详情,请参阅“API 版本”主题

API 更新

  • GenerateContent 是用于聊天和文本的单个统一端点。
  • 通过 StreamGenerateContent 方法提供流式传输。
  • 多模态功能:图片是一种新支持的模态
  • 新增了 Beta 版功能:
  • 更新了候选回答数量:Gemini 模型仅返回 1 个候选回答。
  • 不同的安全设置和 SafetyRating 类别。如需了解详情,请参阅安全设置
  • 目前尚不支持对 Gemini 模型进行调参(正在开发中)。