速率限制用于控制您在给定时间范围内可以向 Gemini API 发出的请求数。这些限制有助于确保公平使用、防范滥用行为,并帮助所有用户维持系统性能。
速率限制的运作方式
速率限制通常从以下三个维度进行衡量:
- 每分钟请求数 (RPM)
- 每分钟 token 数(输入)(TPM)
- 每日请求数 (RPD)
我们会根据每项限制评估您的用量,如果超出任何一项限制,系统都会触发速率限制错误。例如,如果您的 RPM 限制为 20,那么在一分钟内发出 21 个请求会导致错误,即使您未超出 TPM 或其他限制也是如此。
速率限制按项目应用,而不是按 API 密钥应用。每天的请求数 (RPD) 配额会在太平洋时间午夜重置。
限额因所用模型而异,并且部分限额仅适用于特定模型。例如,每分钟生成的图片数 (IPM) 仅针对能够生成图片的模型(Imagen 3)计算,但在概念上与 TPM 类似。其他模型可能设有每日 token 数量上限 (TPD)。
实验性模型和预览版模型的速率限制更为严格。
使用层级
速率限制与项目的用量层级相关联。随着 API 使用量和支出的增加,您可以选择升级到更高的层级,以获得更高的速率限制。
第 2 级和第 3 级的资格条件是根据与您的项目相关联的结算账号在 Google Cloud 服务(包括但不限于 Gemini API)上的累计总支出确定的。
| 层级 | 资格要求 |
|---|---|
| 免费 | 位于符合条件的国家/地区的用户 |
| 第 1 层级 | 与项目关联的完整付费结算账号 |
| 第 2 层级 | 总支出:超过 250 美元,并且自成功付款以来已至少 30 天 |
| 第 3 级 | 总支出:超过 1,000 美元,并且自成功付款以来已至少 30 天 |
当您申请升级时,我们的自动化滥用行为防范系统会执行额外的检查。虽然满足所述资格条件通常足以获得批准,但在极少数情况下,升级申请可能会因审核过程中发现的其他因素而被拒绝。
此系统有助于维护 Gemini API 平台对所有用户的安全性和完整性。
Gemini API 速率限制
速率限制取决于多种因素(例如您的配额层级),您可以在 Google AI Studio 中查看这些限制。随着您的会员等级和账号状态随时间变化,您的速率限制会自动更新。
指定的速率限制无法保证,实际容量可能会有所不同。
批量 API 速率限制
批量 API 请求有自己的速率限制,与非批量 API 调用分开。
- 并发批量请求数:100
- 输入文件大小限制:2 GB
- 文件存储空间上限:20 GB
- 每个模型的排队 token 数:批量排队 token 数表格列出了针对给定模型,所有有效批量作业可排队进行批量处理的最大 token 数。
第 1 层级
| 型号 | 批量入队的令牌 | |||
|---|---|---|---|---|
| 文本输出模型 | ||||
| Gemini 3 Pro 预览版 | 5000 万 | |||
| Gemini 2.5 Pro | 5000000 | |||
| Gemini 2.5 Flash | 3,000,000 | |||
| Gemini 2.5 Flash 预览版 | 3,000,000 | |||
| Gemini 2.5 Flash-Lite | 1000 万 | |||
| Gemini 2.5 Flash-Lite 预览版 | 1000 万 | |||
| Gemini 2.0 Flash | 1000 万 | |||
| Gemini 2.0 Flash-Lite | 1000 万 | |||
| 多模态生成模型 | ||||
| Gemini 3 Pro Image 预览版 🍌 | 200 万 | |||
第 2 层级
| 型号 | 批量入队的令牌 | |||
|---|---|---|---|---|
| 文本输出模型 | ||||
| Gemini 3 Pro 预览版 | 500,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash 预览版 | 400,000,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.5 Flash-Lite 预览版 | 500,000,000 | |||
| Gemini 2.0 Flash | 10 亿 | |||
| Gemini 2.0 Flash-Lite | 10 亿 | |||
| 多模态生成模型 | ||||
| Gemini 3 Pro Image 预览版 🍌 | 2.7 亿 | |||
第 3 级
| 型号 | 批量入队的令牌 | |||
|---|---|---|---|---|
| 文本输出模型 | ||||
| Gemini 3 Pro 预览版 | 10 亿 | |||
| Gemini 2.5 Pro | 10 亿 | |||
| Gemini 2.5 Flash | 10 亿 | |||
| Gemini 2.5 Flash 预览版 | 10 亿 | |||
| Gemini 2.5 Flash-Lite | 10 亿 | |||
| Gemini 2.5 Flash-Lite 预览版 | 10 亿 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| 多模态生成模型 | ||||
| Gemini 3 Pro Image 预览版 🍌 | 10 亿 | |||
如何升级到更高级别
Gemini API 使用 Cloud Billing 来处理所有结算服务。如需从免费层级过渡到付费层级,您必须先为 Google Cloud 项目启用 Cloud Billing。
当您的项目满足指定条件后,即可升级到下一个层级。如需申请升级,请按以下步骤操作:
快速验证后,项目将升级到下一个层级。
申请提高速率限制
每种模型变体都有关联的速率限制(每分钟请求数,RPM)。 如需详细了解这些速率限制,请参阅 Gemini 模型。
我们无法保证一定会提高您的速率限制,但会尽力审核您的申请。