速率限制

速率限制用于规范您在给定时间范围内可以向 Gemini API 发出的请求数。这些限制有助于确保公平使用、防范滥用行为,并帮助所有用户维持系统性能。

在 AI Studio 中查看有效的速率限制

速率限制的运作方式

速率限制通常从以下三个维度进行衡量:

  • 每分钟请求数 (RPM)
  • 每分钟 token 数(输入)(TPM)
  • 每日请求数 (RPD)

我们会根据每项限制评估您的用量,如果超出任何一项限制,系统都会触发速率限制错误。例如,如果您的 RPM 限制为 20,那么即使您未超出 TPM 或其他限制,在一分钟内发出 21 个请求也会导致错误。

速率限制是按项目应用,而不是按 API 密钥应用。每日请求数 (RPD) 配额会在美国太平洋时间午夜重置。

限制因所使用的具体模型而异,并且某些限制仅适用于特定模型。例如,每分钟图片数 (IPM) 仅针对能够生成图片的模型(Nano Banana)计算,但从概念上讲与 TPM 类似。其他模型可能具有每日 token 数限制 (TPD)。

对于实验性模型和预览版模型,速率限制更为严格。

使用层级

速率限制与项目的使用层级相关联。随着 API 用量和支出的增加,您将自动升级到更高的层级,并获得更高的速率限制。

第 2 层级和第 3 层级的资格条件基于与您的项目关联的结算账号在 Google Cloud 服务(包括但不限于 Gemini API)上的累计总支出。

使用层级 资格条件 结算层级上限
免费 有效项目或免费试用 不适用
第 1 层级 设置并关联有效的结算账号 $250
第 2 层级 已支付 $100 且自首次成功付款时起已满 3 天 $2,000
第 3 层级 已支付 $1,000 且自首次成功付款时起已满 30 天 $20,000 - $100,000+

虽然满足所述资格条件通常足以获得批准,但在极少数情况下,升级申请可能会因审核过程中发现的其他因素而被拒绝。

此系统有助于为所有用户维护 Gemini API 平台的安全性和完整性。

Gemini API 速率限制

速率限制取决于多种因素(例如您的使用层级),您可以在 Google AI Studio 中查看。随着您的层级和账号状态随时间变化,您的速率限制将自动更新。

在 AI Studio 中查看有效的速率限制

指定的速率限制无法保证,实际容量可能会有所不同。

优先级推断速率限制

优先级消耗有自己的速率 限制,即使消耗计入整体互动流量 速率限制。默认速率限制为:每个模型和层级的 标准速率限制 的 0.3 倍

批量 API 速率限制

批量 API 请求受其自身的速率 限制约束,与非批量 API 调用分开。

  • 并发批量请求数: 100
  • 输入文件大小限制: 2GB
  • 文件存储限制: 20GB
  • 每个模型排队的 token 数批量排队的 token 数 表列出了针对给定模型的所有有效批量作业,可以排队进行批量处理的最大 token 数。

第 1 层级

模型 批量排队的 token 数
文本输出模型
Gemini 3.1 Pro 预览版 5,000,000
Gemini 3.1 Flash-Lite 预览版 10,000,000
Gemini 3 Flash 预览版 3,000,000
Gemini 2.5 Pro 5,000,000
Gemini 2.5 Pro TTS 25,000
Gemini 2.5 Flash 3,000,000
Gemini 2.5 Flash 预览版 3,000,000
Gemini 2.5 Flash Image 预览版 3,000,000
Gemini 2.5 Flash TTS 100,000
Gemini 2.5 Flash-Lite 10,000,000
Gemini 2.5 Flash-Lite 预览版 10,000,000
Gemini 2.0 Flash 10,000,000
Gemini 2.0 Flash Image 3,000,000
Gemini 2.0 Flash-Lite 10,000,000
多模态生成模型
Gemini 3.1 Flash Image 预览版 🍌 1,000,000
Gemini 3 Pro Image 预览版 🍌 2,000,000
嵌入模型
Gemini Embedding 500,000

第 2 层级

模型 批量排队的 token 数
文本输出模型
Gemini 3.1 Pro 预览版 500,000,000
Gemini 3.1 Flash-Lite 预览版 500,000,000
Gemini 3.1 Flash 预览版 400,000,000
Gemini 2.5 Pro 500,000,000
Gemini 2.5 Pro TTS 100,000
Gemini 2.5 Flash 400,000,000
Gemini 2.5 Flash 预览版 400,000,000
Gemini 2.5 Flash Image 预览版 400,000,000
Gemini 2.5 Flash TTS 100,000
Gemini 2.5 Flash-Lite 500,000,000
Gemini 2.5 Flash-Lite 预览版 500,000,000
Gemini 2.0 Flash 1,000,000,000
Gemini 2.0 Flash Image 400,000,000
Gemini 2.0 Flash-Lite 1,000,000,000
多模态生成模型
Gemini 3.1 Flash Image 预览版 🍌 250,000,000
Gemini 3 Pro Image 预览版 🍌 270,000,000
嵌入模型
Gemini Embedding 5,000,000

第 3 层级

模型 批量排队的 token 数
文本输出模型
Gemini 3.1 Pro 预览版 1,000,000,000
Gemini 3.1 Flash-Lite 预览版 1,000,000,000
Gemini 3.1 Flash 预览版 1,000,000,000
Gemini 2.5 Pro 1,000,000,000
Gemini 2.5 Pro TTS 1,000,000
Gemini 2.5 Flash 1,000,000,000
Gemini 2.5 Flash 预览版 1,000,000,000
Gemini 2.5 Flash Image 预览版 1,000,000,000
Gemini 2.5 Flash TTS 4,000,000
Gemini 2.5 Flash-Lite 1,000,000,000
Gemini 2.5 Flash-Lite 预览版 1,000,000,000
Gemini 2.0 Flash 5,000,000,000
Gemini 2.0 Flash Image 1,000,000,000
Gemini 2.0 Flash-Lite 5,000,000,000
多模态生成模型
Gemini 3.1 Flash Image 预览版 🍌 750,000,000
Gemini 3 Pro Image 预览版 🍌 1,000,000,000
嵌入模型
Gemini Embedding 10,000,000

如何升级到下一层级

如需从免费层级过渡到付费层级,您必须先 在 AI Studio 中设置结算

项目满足指定条件后,将 自动升级到下一层级。从免费层级升级到第 1 层级通常会立即生效,后续层级升级将在 10 分钟内生效。如需查看您的层级,请前往 AI Studio 中的“项目”页面。

申请提高速率限制

每个模型变体都有关联的速率限制(每分钟请求数,RPM)。 如需详细了解这些速率限制,请参阅 AI Studio 速率限制页面。

申请提高付费层级的速率限制

我们无法保证会提高您的速率限制,但我们会尽力审核您的申请。