本指南概略說明各種 Gemini API 計費選項。 說明如何啟用計費功能及監控用量,並解答 帳單常見問題
帳單簡介
Gemini API 按兩個計費級別計費:免付費 (或免費) 和即付即用方案 (或付費)。定價和費率限制不同 而且會因模型而異如要查看目前的價格和費率限制 請參閱「定價」。如需按模型分類的功能細目,請參閱 Gemini 模型頁面。
頻率限制
頻率限制是一種配額, 限制能傳送至 Gemini API 的要求或權杖數量上限 指定時間範圍每個要求或每個權杖都有可能套用頻率限制。請參考 以下舉例說明特定模型可能會套用至特定模型的配額:
- 10 RPM (每分鐘的要求數量)
- 10,000 TPM (每分鐘權杖)
- 每秒要求數 1,000 (每日要求數)
在本範例中,如果千次曝光收益超過 10 次 (或 TPM 或 1,000 RPD),
Gemini API 服務擲回 429: RESOURCE_EXHAUSTED
錯誤,指出
確認已達頻率上限
為什麼要使用付費方案?
啟用計費功能並使用付費方案後,即可享有更高的費率 也會參考你的提示和回覆改善 Google 產品 如要進一步瞭解付費服務的資料使用方式,請參閱 服務條款。
Cloud Billing
Gemini API 會使用 Cloud Billing 。如要使用付費方案,您必須在以下位置設定 Cloud Billing: 您的雲端專案啟用 Cloud Billing 後,您可以使用 Cloud 可追蹤支出、瞭解費用、支付款項及存取資料的帳單工具 提供 Cloud Billing 支援。
啟用計費功能
您可以從 Google AI Studio 啟用 Cloud Billing:
開啟 Google AI Studio。
選取左側欄底部的「設定」> 方案資訊。
如要啟用 Cloud Billing,請點選所選專案的「設定帳單」。
監控使用情形
啟用 Cloud Billing 後,您可以監控 Gemini API 的使用情形:
這個
Google Cloud 控制台。
API 的服務名稱為 generativelanguage.googleapis.com
,
Gemini API 又稱為 Generative Language API
詳情請參閱 monitoring API 用量。
常見問題
本節提供常見問題的解答。
我需要支付哪些費用?
Gemini API 是依據下列項目計費:
- 輸入詞元數量
- 輸出符記數量
- 快取權杖數量
- 快取權杖儲存時間
如需定價資訊,請參閱定價頁面。
如何查看配額?
如要查看配額和系統限制,請前往 Google Cloud 控制台。
我可以在歐洲經濟區 (包括歐盟)、英國和瑞士免費使用 Gemini API 嗎?
API 提供兩種模型:
- 付費模型,包括 Gemini 1.5 Flash、Gemini 1.5 Pro 和 Gemini 1.0 Pro:這些模型在歐洲經濟區 (包括 EU)、英國和瑞士。開發人員必須完成必要步驟 設定帳單帳戶並支付使用費。
- 特定模型可透過 Gemini API 免費存取。(詳情請參閱 ai.google.dev/pricing 進一步瞭解收費模式。 其他模型則是免費的)。不過,您還是需要設定帳單資訊 才能使用這些模式
使用 Gemini API 設定帳單時,要支付 Google AI Studio 使用費嗎?
否,無論是否設定 Google AI Studio,都無須付費 帳單。
我可以在免費方案中使用 100 萬個符記嗎?
Gemini API 的免費方案會因所選模型而異。目前您 可以透過以下幾種方式試用 100 萬個詞元的脈絡窗口:
- 在 Google AI Studio 中
- 提供即付即用方案
- 特定型號的免付費方案
前往 定價頁面。
如何計算我使用的權杖數量?
使用 GenerativeModel.count_tokens
方法。詳情請參閱
權杖指南:進一步瞭解權杖。
帳單的處理方式為何?
Gemini API 的帳單會由 Cloud Billing 系統。
系統是否會對失敗的要求收費?
如果請求失敗且出現 400 或 500 錯誤,系統不會向您收取 符記不過,這項要求仍會計入您的配額。
微調模型需要付費嗎?
模型調整為免費服務,但推論時需使用 模型的計費費率與基本模型相同。
GetTokens 是否會計費?
向 GetTokens API 發出的要求不計費,因此不會計入 推論配額
哪裡可以取得帳單相關協助?
如需帳單相關協助,請參閱 取得 Cloud Billing 支援。