速率限制

速率限制用于控制您在给定时间范围内可以向 Gemini API 发出的请求数。这些限制有助于维持公平的使用环境、防范滥用行为,并帮助所有用户维持系统性能。

在 AI Studio 中查看有效速率限制

速率限制的运作方式

速率限制通常从以下三个维度进行衡量:

  • 每分钟请求数 (RPM)
  • 每分钟 token 数(输入)(TPM)
  • 每日请求数 (RPD)

我们会根据每项限制评估您的用量,如果超出任何一项限制,系统都会触发速率限制错误。例如,如果您的 RPM 限制为 20,那么在一分钟内发出 21 个请求会导致错误,即使您未超出 TPM 或其他限制也是如此。

速率限制按项目应用,而不是按 API 密钥应用。每天的请求数 (RPD) 配额会在太平洋时间午夜重置。

限额因所用模型而异,并且部分限额仅适用于特定模型。例如,每分钟生成的图片数 (IPM) 仅针对能够生成图片的模型(Nano Banana)计算,但在概念上与 TPM 类似。其他模型可能设有每日 token 数量上限 (TPD)。

实验性模型和预览版模型的速率限制更为严格。

使用层级

速率限制与项目的用量层级相关联。随着 API 使用量和支出的增加,您可以选择升级到更高级别,从而获得更高的速率限制。

第 2 级和第 3 级的资格条件是根据与您的项目相关联的结算账号在 Google Cloud 服务(包括但不限于 Gemini API)上的累计总支出确定的。

层级 资格要求
免费 位于符合条件的国家/地区的用户
第 1 层级 与项目关联的完整付费结算账号
第 2 层级 总支出:超过 250 美元,并且自成功付款以来已至少 30 天
第 3 级 总支出:超过 1,000 美元,并且自成功付款以来已至少 30 天

当您申请升级时,我们的自动化滥用行为防范系统会执行额外的检查。虽然满足所述资格条件通常足以获得批准,但在极少数情况下,升级申请可能会因审核过程中发现的其他因素而被拒绝。

此系统有助于维护 Gemini API 平台对所有用户的安全性和完整性。

Gemini API 速率限制

速率限制取决于多种因素(例如您的配额层级),您可以在 Google AI Studio 中查看。随着您的会员等级和账号状态随时间变化,您的速率限制会自动更新。

在 AI Studio 中查看有效速率限制

指定的速率限制无法保证,实际容量可能会有所不同。

批量 API 速率限制

批量 API 请求有自己的速率限制,与非批量 API 调用分开。

  • 并发批量请求数:100
  • 输入文件大小限制:2 GB
  • 文件存储空间上限:20 GB
  • 每个模型的排队 token 数批量排队 token 数表格列出了针对给定模型,所有有效批量作业可排队进行批量处理的最大 token 数。

第 1 层级

型号 批量入队的令牌
文本输出模型
Gemini 3 Pro 预览版 5000000
Gemini 3 Flash 预览版 3,000,000
Gemini 2.5 Pro 5000000
Gemini 2.5 Pro TTS 25000
Gemini 2.5 Flash 3,000,000
Gemini 2.5 Flash 预览版 3,000,000
Gemini 2.5 Flash Image 预览版 3,000,000
Gemini 2.5 Flash TTS 100000
Gemini 2.5 Flash-Lite 1000 万
Gemini 2.5 Flash-Lite 预览版 1000 万
Gemini 2.0 Flash 1000 万
Gemini 2.0 Flash 图片 3,000,000
Gemini 2.0 Flash-Lite 1000 万
多模态生成模型
Gemini 3 Pro Image 预览版 🍌 200 万

第 2 层级

型号 批量入队的令牌
文本输出模型
Gemini 3 Pro 预览版 500,000,000
Gemini 3 Flash 预览版 400,000,000
Gemini 2.5 Pro 500,000,000
Gemini 2.5 Pro TTS 100000
Gemini 2.5 Flash 400,000,000
Gemini 2.5 Flash 预览版 400,000,000
Gemini 2.5 Flash Image 预览版 400,000,000
Gemini 2.5 Flash TTS 100000
Gemini 2.5 Flash-Lite 500,000,000
Gemini 2.5 Flash-Lite 预览版 500,000,000
Gemini 2.0 Flash 10 亿
Gemini 2.0 Flash 图片 400,000,000
Gemini 2.0 Flash-Lite 10 亿
多模态生成模型
Gemini 3 Pro Image 预览版 🍌 2.7 亿

第 3 级

型号 批量入队的令牌
文本输出模型
Gemini 3 Pro 预览版 10 亿
Gemini 3 Flash 预览版 10 亿
Gemini 2.5 Pro 10 亿
Gemini 2.5 Pro TTS 100 万
Gemini 2.5 Flash 10 亿
Gemini 2.5 Flash 预览版 10 亿
Gemini 2.5 Flash Image 预览版 10 亿
Gemini 2.5 Flash TTS 4,000,000
Gemini 2.5 Flash-Lite 10 亿
Gemini 2.5 Flash-Lite 预览版 10 亿
Gemini 2.0 Flash 5,000,000,000
Gemini 2.0 Flash 图片 10 亿
Gemini 2.0 Flash-Lite 5,000,000,000
多模态生成模型
Gemini 3 Pro Image 预览版 🍌 10 亿

如何升级到更高级别

Gemini API 使用 Cloud Billing 来处理所有结算服务。如需从免费层级过渡到付费层级,您必须先为 Google Cloud 项目启用 Cloud Billing。

当您的项目满足指定条件后,即可升级到下一个层级。如需申请升级,请按以下步骤操作:

快速验证后,项目将升级到下一个层级。

申请提高速率限制

每种模型变体都有关联的速率限制(每分钟请求数,RPM)。 如需详细了解这些速率限制,请参阅 Gemini 模型

申请提高付费层级的速率限制

我们无法保证一定会提高您的速率限制,但会尽力审核您的申请。