本指南简要介绍了不同的 Gemini API 结算选项, 说明了如何启用结算功能和监控使用情况,并解答了 常见问题解答 (FAQ)。
关于结算
Gemini API 的结算基于两个价格层级:免费 (或免费)和随用随付(或付费)。价格和速率限制有所不同 也因模型而异。如需了解当前价格和速率限制 请参阅定价。有关各模型功能详解,请参阅 Gemini 模型页面。
速率限制
速率限制是指配额 限制您在 。速率限制可按请求或令牌应用。这里有 可能适用于给定层级中给定模型的配额的虚构示例:
- 10 RPM(每分钟请求数)
- 10,000 TPM(每分钟令牌数)
- 1,000 RPD(每日请求数)
在此示例中,如果您超过 10 RPM(或 10,000 TPM 或 1,000 RPD),
Gemini API 服务抛出 429: RESOURCE_EXHAUSTED
错误,指明
您已超出速率限制
为何使用付费层级?
启用结算功能并使用付费层级后,您可以享受更高的费率 限制,而且你的提示和回答不会被用于改进 Google 产品。 要详细了解付费服务的数据使用方式,请参阅 服务条款。
Cloud Billing
Gemini API 使用 Cloud Billing 。如需使用付费层级,您必须在以下位置设置 Cloud Billing: Google Cloud 项目启用 Cloud Billing 后 用于跟踪支出、了解费用、付款和访问的结算工具 Cloud Billing 支持。
启用结算功能
您可以从 Google AI Studio 开始启用 Cloud Billing:
打开 Google AI Studio。
在左侧边栏的底部,选择设置 > 方案信息。
点击所选项目对应的设置结算信息,以启用 Cloud Billing。
监控用量
启用 Cloud Billing 后,您可以在以下位置监控 Gemini API 的使用情况:
该
Google Cloud 控制台。
该 API 的服务名称为 generativelanguage.googleapis.com
,
Gemini API 也称为生成式语言 API。
如需了解详情,请参阅关于以下内容的 Google Cloud 文档: 监控 API 使用情况。
常见问题解答
这一部分解答了常见问题。
我需要为哪些项目付费?
Gemini API 的价格取决于以下因素:
- 输入词元数量
- 输出词元数量
- 缓存的令牌数
- 缓存令牌存储时长
如需了解价格信息,请参阅价格页面。
在哪里可以查看我的配额?
您可以在以下位置查看您的配额和系统限制: Google Cloud 控制台。
我可以在欧洲经济区(包括欧盟)、英国和瑞士免费使用 Gemini API 吗?
该 API 提供两组模型:
- 付费模型,包括 Gemini 1.5 Flash、Gemini 1.5 Pro 和 Gemini 1.0 专业。这些模型在 EEA(包括 欧盟)、英国和瑞士。开发者必须完成必要的步骤 以设置结算账号并支付使用费。
- 某些模型可通过 Gemini API 免费访问。(请参阅 如需详细了解我们对哪些型号收费,请访问 ai.google.dev/pricing; 其他模型则免费)。不过,您仍然需要设置结算信息 来使用这些模型
如果我使用 Gemini API 设置结算信息,我需要为 Google AI Studio 用量付费吗?
不可以,无论您是否设置 Google AI Studio,都可以免费使用 Google AI Studio 。
我可以使用免费层级的 100 万个令牌吗?
Gemini API 的免费层级因所选模型而异。目前,您 可以通过以下方式尝试 100 万个词元的上下文窗口:
- 在 Google AI Studio 中
- 采用随用随付方案
- 部分车型可享免费方案
如需查看每种模型的最新免费速率限制,请访问 价格页面。
如何计算我使用的令牌数量?
使用 GenerativeModel.count_tokens
方法计算词元数量。请参阅
如需详细了解令牌,请参阅令牌指南。
结算是如何处理的?
Gemini API 的结算由 Cloud Billing 系统。
失败的请求需要付费吗?
如果您的请求失败并显示 400 或 500 错误,那么您无需为 个词元。不过,该请求仍会计入您的配额。
微调模型是否需要付费?
模型调优免费,但经过调优的推断 与基本模型按相同的费率计费。
是否对 GetTokens 收费?
针对 GetTokens API 的请求不会计费,也不会计入 推理配额。
在哪里可以获得结算方面的帮助?
如需结算方面的帮助,请参阅 获取 Cloud Billing 支持。