Interactions API 现已正式发布。我们建议使用此 API 来访问所有最新功能和模型。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

速率限制

速率限制用于规范您在给定时间范围内可以向 Gemini API 发出的请求数。这些限制有助于确保公平使用、防范滥用行为，并帮助所有用户维持系统性能。

速率限制的运作方式

速率限制通常从以下三个维度进行衡量：

我们会根据每项限制评估您的用量，如果超出任何一项限制，系统都会触发速率限制错误。例如，如果您的 RPM 限制为 20，那么在一分钟内发出 21 个请求会导致错误，即使您未超出 TPM 或其他限制也是如此。

速率限制按项目应用，而不是按 API 密钥应用。每天的请求数（RPD）配额会在太平洋时间午夜重置。

限额因所用模型而异，并且部分限额仅适用于特定模型。例如，每分钟生成的图片数 (IPM) 仅针对能够生成图片的模型（Nano Banana）计算，但在概念上与 TPM 类似。其他模型可能设有每日 token 数量上限 (TPD)。

实验性模型和预览版模型的速率限制更为严格。

除了每分钟请求数 (RPM) 和每分钟令牌数 (TPM) 限制之外，Gemini API 还强制执行基于支出的速率限制，以防产生意外费用。这些限额是否适用于您的账号取决于您的结算记录和用量层级。

下表显示了每个使用量层级的基于支出的速率限制。这些限制是在 10 分钟的滚动时间窗口内进行评估的。这些限额是否适用于您的账号取决于您的结算记录和账号状态。

如果您达到基于支出的速率限制，API 会返回 429 RESOURCE_EXHAUSTED 错误。如需解决此问题，请执行以下操作：

速率限制与项目的用量层级相关联。随着 API 用量和支出的增加，您将自动升级到具有更高速率限制的更高层级。

第 2 级和第 3 级的资格条件是根据与您的项目相关联的结算账号在 Google Cloud 服务（包括但不限于 Gemini API）上的累计总支出确定的。

虽然满足所述资格条件通常足以获得批准，但在极少数情况下，升级申请可能会因审核过程中发现的其他因素而被拒绝。

此系统有助于维护 Gemini API 平台对所有用户的安全性和完整性。

速率限制取决于多种因素（例如您的用量层级），您可以在 Google AI Studio 中查看。随着您的会员等级和账号状态随时间变化，费率限制会自动更新。

指定的速率限制无法保证，实际容量可能会有所不同。

优先消耗量有自己的速率限制，即使该消耗量计入总体互动流量速率限制也是如此。默认速率限制为：每种模型和层级的标准速率限制的 0.3 倍

批量 API 请求有自己的速率限制，与非批量 API 调用分开。

如需从免费层级过渡到付费层级，您必须先在 AI Studio 中设置结算信息。

一旦您的项目满足指定条件，系统便会自动将其升级到下一层级。从免费层级升级到层级 1 通常会立即生效，后续的层级升级会在 10 分钟内生效。前往 AI Studio 中的项目页面，查看您的层级。

每种模型变体都有关联的速率限制（每分钟请求数，RPM）。如需详细了解这些速率限制，请参阅 AI Studio 速率限制页面。

我们无法保证一定会提高您的速率限制，但会尽力审核您的请求。