計費方式

本指南概略說明各種 Gemini API 計費選項。 說明如何啟用計費功能及監控用量,並解答 帳單常見問題

帳單簡介

Gemini API 按兩個計費級別計費:免付費 (或免費) 和即付即用方案 (或付費)。定價和費率限制不同 而且會因模型而異如要查看目前的價格和費率限制 請參閱「定價」。如需按模型分類的功能細目,請參閱 Gemini 模型頁面

頻率限制

頻率限制是一種配額, 限制能傳送至 Gemini API 的要求或權杖數量上限 指定時間範圍每個要求或每個權杖都有可能套用頻率限制。請參考 以下舉例說明特定模型可能會套用至特定模型的配額:

  • 10 RPM (每分鐘的要求數量)
  • 10,000 TPM (每分鐘權杖)
  • 每秒要求數 1,000 (每日要求數)

在本範例中,如果千次曝光收益超過 10 次 (或 TPM 或 1,000 RPD), Gemini API 服務擲回 429: RESOURCE_EXHAUSTED 錯誤,指出 確認已達頻率上限

啟用計費功能並使用付費方案後,即可享有更高的費率 也會參考你的提示和回覆改善 Google 產品 如要進一步瞭解付費服務的資料使用方式,請參閱 服務條款

Cloud Billing

Gemini API 會使用 Cloud Billing 。如要使用付費方案,您必須在以下位置設定 Cloud Billing: 您的雲端專案啟用 Cloud Billing 後,您可以使用 Cloud 可追蹤支出、瞭解費用、支付款項及存取資料的帳單工具 提供 Cloud Billing 支援。

啟用計費功能

您可以從 Google AI Studio 啟用 Cloud Billing:

  1. 開啟 Google AI Studio

  2. 選取左側欄底部的「設定」> 方案資訊

  3. 如要啟用 Cloud Billing,請點選所選專案的「設定帳單」

監控使用情形

啟用 Cloud Billing 後,您可以監控 Gemini API 的使用情形: 這個 Google Cloud 控制台。 API 的服務名稱為 generativelanguage.googleapis.com, Gemini API 又稱為 Generative Language API

Cloud 控制台

詳情請參閱 monitoring API 用量

常見問題

本節提供常見問題的解答。

我需要支付哪些費用?

Gemini API 是依據下列項目計費:

  • 輸入詞元數量
  • 輸出符記數量
  • 快取權杖數量
  • 快取權杖儲存時間

如需定價資訊,請參閱定價頁面

如何查看配額?

如要查看配額和系統限制,請前往 Google Cloud 控制台

我可以在歐洲經濟區 (包括歐盟)、英國和瑞士免費使用 Gemini API 嗎?

API 提供兩種模型:

  1. 付費模型,包括 Gemini 1.5 Flash、Gemini 1.5 Pro 和 Gemini 1.0 Pro:這些模型在歐洲經濟區 (包括 EU)、英國和瑞士。開發人員必須完成必要步驟 設定帳單帳戶並支付使用費。
  2. 特定模型可透過 Gemini API 免費存取。(詳情請參閱 ai.google.dev/pricing 進一步瞭解收費模式。 其他模型則是免費的)。不過,您還是需要設定帳單資訊 才能使用這些模式

使用 Gemini API 設定帳單時,要支付 Google AI Studio 使用費嗎?

否,無論是否設定 Google AI Studio,都無須付費 帳單。

我可以在免費方案中使用 100 萬個符記嗎?

Gemini API 的免費方案會因所選模型而異。目前您 可以透過以下幾種方式試用 100 萬個詞元的脈絡窗口:

  • 在 Google AI Studio 中
  • 提供即付即用方案
  • 特定型號的免付費方案

前往 定價頁面

如何計算我使用的權杖數量?

使用 GenerativeModel.count_tokens 方法。詳情請參閱 權杖指南:進一步瞭解權杖。

帳單的處理方式為何?

Gemini API 的帳單會由 Cloud Billing 系統。

系統是否會對失敗的要求收費?

如果請求失敗且出現 400 或 500 錯誤,系統不會向您收取 符記不過,這項要求仍會計入您的配額。

微調模型需要付費嗎?

模型調整為免費服務,但推論時需使用 模型的計費費率與基本模型相同。

GetTokens 是否會計費?

向 GetTokens API 發出的要求不計費,因此不會計入 推論配額

哪裡可以取得帳單相關協助?

如需帳單相關協助,請參閱 取得 Cloud Billing 支援