速率限制用于规范您在给定时间范围内可以向 Gemini API 发出的请求数。这些限制有助于确保公平使用、防范滥用行为,并帮助所有用户维持系统性能。
速率限制的运作方式
速率限制通常从以下三个维度进行衡量:
- 每分钟请求数 (RPM)
- 每日请求数 (RPD)
- 每分钟令牌数(输入)(TPM)
我们会根据每项限制评估您的用量,如果超出任何一项限制,系统都会触发速率限制错误。例如,如果您的 RPM 限制为 20,那么在一分钟内发出 21 个请求会导致错误,即使您未超出 TPM 或其他限制也是如此。
速率限制按项目应用,而不是按 API 密钥应用。
限额因所用特定模型而异,并且部分限额仅适用于特定模型。例如,每分钟生成的图片数 (IPM) 仅针对能够生成图片的模型(Imagen 3)计算,但在概念上与 TPM 类似。其他模型可能设有每日 token 数量上限 (TPD)。
实验性模型和预览版模型的速率限制更为严格。
使用层级
速率限制与项目的用量层级相关联。随着 API 使用量和支出的增加,您可以选择升级到更高的层级,以提高速率限制。
层级 | 资格要求 |
---|---|
免费 | 符合条件的国家/地区的用户 |
第 1 层级 | 与项目关联的结算账号 |
第 2 层级 | 总支出:超过 250 美元,并且自成功付款以来已至少 30 天 |
第 3 级 | 总支出:超过 1,000 美元,并且自成功付款以来已至少 30 天 |
当您申请升级时,我们的自动化滥用行为防范系统会执行额外的检查。虽然满足所述资格条件通常足以获得批准,但在极少数情况下,升级申请可能会因审核过程中发现的其他因素而被拒绝。
此系统有助于维护 Gemini API 平台对所有用户的安全性和完整性。
当前速率限制
免费层级
型号 | 每千次展示收入 | TPM | RPD |
---|---|---|---|
Gemini 2.5 Pro | -- | -- | -- |
Gemini 2.5 Flash | 10 | 250000 | 250 |
Gemini 2.5 Flash-Lite 预览版 06-17 | 15 | 250000 | 1000 |
Gemini 2.5 Flash 预览版 TTS | 3 | 10000 | 15 |
Gemini 2.5 Pro 预览版 TTS | -- | -- | -- |
Gemini 2.0 Flash | 15 | 1,000,000 | 200 |
Gemini 2.0 Flash 预览版图片生成 | 10 | 200000 | 100 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
Imagen 3 | -- | -- | -- |
Veo 2 | -- | -- | -- |
Gemini 1.5 Flash(已弃用) | 15 | 250000 | 50 |
Gemini 1.5 Flash-8B(已弃用) | 15 | 250000 | 50 |
Gemini 1.5 Pro(已弃用) | -- | -- | -- |
Gemma 3 和 3n | 30 | 15000 | 14,400 |
Gemini Embedding Experimental 03-07 | 5 | -- | 100 |
第 1 层级
型号 | 每千次展示收入 | TPM | RPD |
---|---|---|---|
Gemini 2.5 Pro | 150 | 200 万 | 1000 |
Gemini 2.5 Flash | 1000 | 1,000,000 | 10000 |
Gemini 2.5 Flash-Lite 预览版 06-17 | 4000 | 4,000,000 | -- |
Gemini 2.5 Flash 预览版 TTS | 10 | 10000 | 100 |
Gemini 2.5 Pro 预览版 TTS | 10 | 10000 | 50 |
Gemini 2.0 Flash | 2000 | 4,000,000 | -- |
Gemini 2.0 Flash 预览版图片生成 | 1000 | 1,000,000 | 10000 |
Gemini 2.0 Flash-Lite | 4000 | 4,000,000 | -- |
Imagen 4 标准版 | 每分钟 10 张图片 (IPM) | -- | 每天 70 张图片 (IPD) |
Imagen 4 Ultra | 每分钟 5 张图片 (IPM) | -- | 每天 30 张图片 (IPD) |
Imagen 3 | 每分钟 20 张图片 (IPM) | -- | -- |
Veo 2 | 每分钟 2 个视频 (VPM) | -- | 每天 50 个视频 (VPD) |
Gemini 1.5 Flash(已弃用) | 2000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B(已弃用) | 4000 | 4,000,000 | -- |
Gemini 1.5 Pro(已弃用) | 1000 | 4,000,000 | -- |
Gemma 3 和 3n | 30 | 15000 | 14,400 |
Gemini Embedding Experimental 03-07 | 10 | -- | 1000 |
第 2 层级
型号 | 每千次展示收入 | TPM | RPD |
---|---|---|---|
Gemini 2.5 Pro | 1000 | 5000000 | 5 万 |
Gemini 2.5 Flash | 2000 | 3,000,000 | 100000 |
Gemini 2.5 Flash-Lite 预览版 06-17 | 10000 | 1000 万 | 100000 |
Gemini 2.5 Flash 预览版 TTS | 1000 | 100000 | 10000 |
Gemini 2.5 Pro 预览版 TTS | 100 | 25000 | 1000 |
Gemini 2.0 Flash | 10000 | 1000 万 | -- |
Gemini 2.0 Flash 预览版图片生成 | 2000 | 3,000,000 | 100000 |
Gemini 2.0 Flash-Lite | 20,000 | 1000 万 | -- |
Imagen 4 标准版 | 每分钟 10 张图片 (IPM) | -- | 每天 70 张图片 (IPD) |
Imagen 4 Ultra | 每分钟 5 张图片 (IPM) | -- | 每天 30 张图片 (IPD) |
Imagen 3 | 每分钟 20 张图片 (IPM) | -- | -- |
Veo 2 | 每分钟 2 个视频 (VPM) | -- | 每天 50 个视频 (VPD) |
Gemini 1.5 Flash(已弃用) | 2000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B(已弃用) | 4000 | 4,000,000 | -- |
Gemini 1.5 Pro(已弃用) | 1000 | 4,000,000 | -- |
Gemma 3 和 3n | 30 | 15000 | 14,400 |
Gemini Embedding Experimental 03-07 | 10 | -- | 1000 |
第 3 级
型号 | 每千次展示收入 | TPM | RPD |
---|---|---|---|
Gemini 2.5 Pro | 2000 | 800 万 | -- |
Gemini 2.5 Flash | 10000 | 800 万 | -- |
Gemini 2.5 Flash-Lite 预览版 06-17 | 30000 | 30,000,000 | -- |
Gemini 2.5 Flash 预览版 TTS | 1000 | 1,000,000 | -- |
Gemini 2.5 Pro 预览版 TTS | 100 | 1,000,000 | -- |
Gemini 2.0 Flash | 30000 | 30,000,000 | -- |
Gemini 2.0 Flash 预览版图片生成 | 5,000 | 5000000 | -- |
Gemini 2.0 Flash-Lite | 30000 | 30,000,000 | -- |
Imagen 4 标准版 | 每分钟 10 张图片 (IPM) | -- | 每天 70 张图片 (IPD) |
Imagen 4 Ultra | 每分钟 5 张图片 (IPM) | -- | 每天 30 张图片 (IPD) |
Imagen 3 | 每分钟 20 张图片 (IPM) | -- | -- |
Veo 2 | 每分钟 2 个视频 (VPM) | -- | 每天 50 个视频 (VPD) |
Gemini 1.5 Flash(已弃用) | 2000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B(已弃用) | 4000 | 4,000,000 | -- |
Gemini 1.5 Pro(已弃用) | 1000 | 4,000,000 | -- |
Gemma 3 和 3n | 30 | 15000 | 14,400 |
Gemini Embedding Experimental 03-07 | 10 | -- | 1000 |
指定的速率限制无法保证,实际容量可能会有所不同。
Live API 速率限制
免费层级
名称 | 并发会话 | TPM | RPD |
---|---|---|---|
Gemini 2.5 Flash Live | 3 | 1,000,000 | -- |
Gemini 2.0 Flash Live | 3 | 1,000,000 | -- |
Gemini 2.5 Flash 预览版原生音频对话框 | 1 | 25000 | 5 |
Gemini 2.5 Flash Experimental 原生音频思考对话框 | 1 | 10000 | 5 |
第 1 层级
名称 | 并发会话 | TPM | RPD |
---|---|---|---|
Gemini 2.5 Flash Live | 50 | 4,000,000 | -- |
Gemini 2.0 Flash Live | 50 | 4,000,000 | -- |
Gemini 2.5 Flash 预览版原生音频对话框 | 3 | 5 万 | 50 |
Gemini 2.5 Flash Experimental 原生音频思考对话框 | 1 | 25000 | 50 |
第 2 层级
名称 | 并发会话 | TPM | RPD |
---|---|---|---|
Gemini 2.5 Flash Live | 1000 | 1000 万 | -- |
Gemini 2.0 Flash Live | 1000 | 1000 万 | -- |
Gemini 2.5 Flash 预览版原生音频对话框 | 100 | 1,000,000 | 无限制 |
Gemini 2.5 Flash Experimental 原生音频思考对话框 | -- | -- | -- |
第 3 级
名称 | 并发会话 | TPM | RPD |
---|---|---|---|
Gemini 2.5 Flash Live | 1000 | 1000 万 | -- |
Gemini 2.0 Flash Live | 1000 | 1000 万 | -- |
Gemini 2.5 Flash 预览版原生音频对话框 | -- | -- | -- |
Gemini 2.5 Flash Experimental 原生音频思考对话框 | -- | -- | -- |
指定的速率限制无法保证,实际容量可能会有所不同。
如何升级到更高级别
Gemini API 使用 Cloud Billing 来处理所有结算服务。如需从免费层级过渡到付费层级,您必须先为 Google Cloud 项目启用 Cloud Billing。
当您的项目符合指定条件后,便有资格升级到下一个层级。如需申请升级,请按以下步骤操作:
经过快速验证后,项目将升级到下一个层级。
申请提高速率限制
每种模型变体都有关联的速率限制(每分钟请求数,RPM)。 如需详细了解这些速率限制,请参阅 Gemini 模型。
我们无法保证一定会提高您的速率限制,但我们会尽力审核您的请求,并在能够满足您的容量需求时与您联系。