速率限制用于规范您在给定时间范围内可以向 Gemini API 发出的请求数。这些限制有助于确保公平使用、防范滥用行为,并帮助所有用户维持系统性能。
速率限制的运作方式
速率限制通常从以下三个维度进行衡量:
- 每分钟请求数 (RPM)
- 每分钟 token 数(输入)(TPM)
- 每日请求数 (RPD)
我们会根据每项限制评估您的用量,如果超出任何一项限制,系统都会触发速率限制错误。例如,如果您的 RPM 限制为 20,那么即使您未超出 TPM 或其他限制,在一分钟内发出 21 个请求也会导致错误。
速率限制是按项目应用,而不是按 API 密钥应用。每日请求数 (RPD) 配额会在美国太平洋时间午夜重置。
限制因所使用的具体模型而异,并且某些限制仅适用于特定模型。例如,每分钟图片数 (IPM) 仅针对能够生成图片的模型(Nano Banana)计算,但从概念上讲与 TPM 类似。其他模型可能具有每日 token 数限制 (TPD)。
对于实验性模型和预览版模型,速率限制更为严格。
使用层级
速率限制与项目的使用层级相关联。随着 API 用量和支出的增加,您将自动升级到更高的层级,并获得更高的速率限制。
第 2 层级和第 3 层级的资格条件基于与您的项目关联的结算账号在 Google Cloud 服务(包括但不限于 Gemini API)上的累计总支出。
| 使用层级 | 资格条件 | 结算层级上限 |
|---|---|---|
| 免费 | 有效项目或免费试用 | 不适用 |
| 第 1 层级 | 设置并关联有效的结算账号 | $250 |
| 第 2 层级 | 已支付 $100 且自首次成功付款时起已满 3 天 | $2,000 |
| 第 3 层级 | 已支付 $1,000 且自首次成功付款时起已满 30 天 | $20,000 - $100,000+ |
虽然满足所述资格条件通常足以获得批准,但在极少数情况下,升级申请可能会因审核过程中发现的其他因素而被拒绝。
此系统有助于为所有用户维护 Gemini API 平台的安全性和完整性。
Gemini API 速率限制
速率限制取决于多种因素(例如您的使用层级),您可以在 Google AI Studio 中查看。随着您的层级和账号状态随时间变化,您的速率限制将自动更新。
指定的速率限制无法保证,实际容量可能会有所不同。
优先级推断速率限制
优先级消耗有自己的速率 限制,即使消耗计入整体互动流量 速率限制。默认速率限制为:每个模型和层级的 标准速率限制 的 0.3 倍
批量 API 速率限制
批量 API 请求受其自身的速率 限制约束,与非批量 API 调用分开。
- 并发批量请求数: 100
- 输入文件大小限制: 2GB
- 文件存储限制: 20GB
- 每个模型排队的 token 数: 批量排队的 token 数 表列出了针对给定模型的所有有效批量作业,可以排队进行批量处理的最大 token 数。
第 1 层级
| 模型 | 批量排队的 token 数 | |||
|---|---|---|---|---|
| 文本输出模型 | ||||
| Gemini 3.1 Pro 预览版 | 5,000,000 | |||
| Gemini 3.1 Flash-Lite 预览版 | 10,000,000 | |||
| Gemini 3 Flash 预览版 | 3,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Gemini 2.5 Pro TTS | 25,000 | |||
| Gemini 2.5 Flash | 3,000,000 | |||
| Gemini 2.5 Flash 预览版 | 3,000,000 | |||
| Gemini 2.5 Flash Image 预览版 | 3,000,000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.5 Flash-Lite 预览版 | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| Gemini 2.0 Flash Image | 3,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| 多模态生成模型 | ||||
| Gemini 3.1 Flash Image 预览版 🍌 | 1,000,000 | |||
| Gemini 3 Pro Image 预览版 🍌 | 2,000,000 | |||
| 嵌入模型 | ||||
| Gemini Embedding | 500,000 | |||
第 2 层级
| 模型 | 批量排队的 token 数 | |||
|---|---|---|---|---|
| 文本输出模型 | ||||
| Gemini 3.1 Pro 预览版 | 500,000,000 | |||
| Gemini 3.1 Flash-Lite 预览版 | 500,000,000 | |||
| Gemini 3.1 Flash 预览版 | 400,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Gemini 2.5 Pro TTS | 100,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash 预览版 | 400,000,000 | |||
| Gemini 2.5 Flash Image 预览版 | 400,000,000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.5 Flash-Lite 预览版 | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash Image | 400,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| 多模态生成模型 | ||||
| Gemini 3.1 Flash Image 预览版 🍌 | 250,000,000 | |||
| Gemini 3 Pro Image 预览版 🍌 | 270,000,000 | |||
| 嵌入模型 | ||||
| Gemini Embedding | 5,000,000 | |||
第 3 层级
| 模型 | 批量排队的 token 数 | |||
|---|---|---|---|---|
| 文本输出模型 | ||||
| Gemini 3.1 Pro 预览版 | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite 预览版 | 1,000,000,000 | |||
| Gemini 3.1 Flash 预览版 | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Gemini 2.5 Pro TTS | 1,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash 预览版 | 1,000,000,000 | |||
| Gemini 2.5 Flash Image 预览版 | 1,000,000,000 | |||
| Gemini 2.5 Flash TTS | 4,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite 预览版 | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| Gemini 2.0 Flash Image | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| 多模态生成模型 | ||||
| Gemini 3.1 Flash Image 预览版 🍌 | 750,000,000 | |||
| Gemini 3 Pro Image 预览版 🍌 | 1,000,000,000 | |||
| 嵌入模型 | ||||
| Gemini Embedding | 10,000,000 | |||
如何升级到下一层级
如需从免费层级过渡到付费层级,您必须先 在 AI Studio 中设置结算。
项目满足指定条件后,将 自动升级到下一层级。从免费层级升级到第 1 层级通常会立即生效,后续层级升级将在 10 分钟内生效。如需查看您的层级,请前往 AI Studio 中的“项目”页面。
申请提高速率限制
每个模型变体都有关联的速率限制(每分钟请求数,RPM)。 如需详细了解这些速率限制,请参阅 AI Studio 速率限制页面。
我们无法保证会提高您的速率限制,但我们会尽力审核您的申请。