本指南將概略說明各種 Gemini API 結帳選項,說明如何啟用結帳功能並監控用量,並提供結帳相關常見問題的解答。
關於帳單
Gemini API 的結帳方式分為兩種定價層級:免付費 (或免費) 和即付即用 (或付費)。價格和費率限制因等級和型號而異。如需瞭解目前的價格和費率限制,請參閱「定價」一文。如需各型號的功能詳細資料,請參閱 Gemini 型號頁面。
頻率限制
頻率限制是配額,用於規範您在指定時間範圍內可向 Gemini API 提出的要求數量。這些限制有助於確保公平使用、防範濫用行為,並為所有使用者維持最佳效能。
速率限制有幾個重要功能:
- 防止濫用:這些機制可保護 API,避免惡意人士嘗試中斷或造成系統過載。
- 確保公平存取權:速率限制可防止任何單一使用者獨佔 API 資源,確保所有使用者都能享有流暢的體驗。
- 管理基礎架構負載:透過控制要求量,頻率限制有助於維持一致的 API 效能,並防止伺服器超載。
以下是虛構的配額範例,可能會套用至特定層級中的特定模型:
- 10 RPM (每分鐘要求次數)
- 10,000 TPM (每分鐘符記)
- 1,000 RPD (每日要求次數)
在這個範例中,如果超出 10 RPM (或 10,000 TPM 或 1,000 RPD),Gemini API 服務就會擲回 429: RESOURCE_EXHAUSTED
錯誤,指出您已超出速率限制。
費率限制的運作方式
頻率限制會根據四個維度進行評估:
- 每分鐘要求數 (RPM)
- 每日要求配額 (RPD)
- 每分鐘符記數 (TPM)
- 每分鐘圖片數 (IPM)
系統會根據各項限制評估您的用量,如果超過任何限制,就會觸發速率限制錯誤。舉例來說,如果 RPM 限制為 20,在 1 分鐘內提出 21 項要求就會導致錯誤,即使您並未超出 TPM 或其他限制也一樣。
頻率限制適用於每個專案,而非每個 API 金鑰。
限制會因所使用的具體模型而異,部分限制僅適用於特定模型。舉例來說,只有可產生圖像的模型才會計算 IPM。
使用量等級和費率限制調高
頻率限制與專案用量等級相關。隨著 API 用量和支出增加,您可以選擇升級至較高的級別,以便提高頻率限制。
級別 | 資格條件 |
---|---|
免費 | 位於適用國家/地區的使用者 |
級別 1 | 已連結帳單帳戶 |
級別 2 | 總支出:$250 美元;總支出金額已達到至少 30 天 |
當您要求升級時,我們的自動濫用行為防護系統會執行額外檢查。雖然符合上述資格條件通常就足以獲得核准,但在少數情況下,升級要求可能會因審查程序中發現的其他因素而遭到拒絕。
這套系統有助於確保 Gemini API 平台對所有使用者都安全可靠。
如何提出升級要求
Gemini API 會使用 Cloud Billing 處理所有帳單服務。如要從免費方案改用付費方案,您必須先為 Google Cloud 專案啟用 Cloud Billing。
當專案符合指定條件時,即可升級至下一個等級。如要申請升級,請按照下列步驟操作:
- 前往 AI Studio API 金鑰頁面。
- 找出要升級的專案,然後按一下「升級」。
- 系統會自動驗證專案是否符合資格。這項程序需要幾秒鐘的時間。
- 如果您的專案符合所有規定,系統會立即將其升級至下一個層級。
為何要使用付費方案?
啟用結帳功能並使用付費方案,您就能享有更高的費率限制,而且系統不會使用提示和回應來改善 Google 產品。如要進一步瞭解付費服務的資料使用情形,請參閱服務條款。
Cloud Billing
Gemini API 會使用 Cloud Billing 提供帳單服務。如要使用付費方案,您必須在雲端專案中設定 Cloud Billing。啟用 Cloud Billing 後,您可以使用 Cloud Billing 工具追蹤支出、瞭解費用、付款,以及取得 Cloud Billing 支援服務。
啟用計費功能
您可以透過 Google AI 工作室啟用 Cloud Billing:
開啟 Google AI Studio。
在左側邊欄底部,依序選取「設定」 >「方案資訊」。
點選所選專案的「設定帳單」,即可啟用 Cloud Billing。
監控用量
啟用 Cloud Billing 後,您可以在 Google Cloud 控制台中監控 Gemini API 的用量。API 的服務名稱為 generativelanguage.googleapis.com
,在控制台中,Gemini API 也稱為「生成式語言 API」。
如需更多資訊,請參閱 Google Cloud 說明文件,瞭解如何監控 API 用量。
常見問題
本節會解答常見問題。
我需要支付什麼費用?
Gemini API 的價格取決於以下因素:
- 輸入符號數量
- 輸出符號數
- 快取的符記數量
- 快取權杖儲存時間長度
如需定價資訊,請參閱定價頁面。
如何查看配額?
您可以在 Google Cloud 控制台中查看配額和系統限制。
如何要求更多的配額?
如要要求提高配額,請按照「如何申請升級」一文中的說明操作。
我可以在歐洲經濟區 (包括歐盟)、英國和瑞士免費使用 Gemini API 嗎?
是的,我們已在許多地區推出免費和付費方案。
如果我設定 Gemini API 結帳功能,是否會被收取 Google AI Studio 使用費?
否,無論您是否在所有支援的區域設定結帳資訊,Google AI Studio 仍可免費使用。
我可以在免費方案中使用 100 萬個符記嗎?
Gemini API 的免費方案會因所選模型而異。目前,您可以透過下列方式試用 100 萬個詞元的脈絡窗口:
- 在 Google AI Studio 中
- 使用即付即用方案
- 可為特定型號提供免付費方案
如要查看每個型號的最新免費費率限制,請前往定價頁面。
如何計算所使用的符記數量?
使用 GenerativeModel.count_tokens
方法來計算符記數。如要進一步瞭解符記,請參閱符記指南。
我可以將 Google Cloud 抵免額用於 Gemini API 嗎?
可以,Google Cloud 抵免額可用於 Gemini API 使用量。
如何處理帳單?
Gemini API 的結帳作業由 Cloud Billing 系統處理。
系統是否會針對失敗的要求向我收費?
如果要求失敗並傳回 400 或 500 錯誤,您就不會被收取使用符記的費用。不過,這項要求仍會計入配額。
微調模型是否需要付費?
模型調整服務免費,但針對經過調整的模型進行推論時,收費標準與基礎模型相同。
是否會針對 GetTokens 收費?
系統不會向您收取 GetTokens API 要求的費用,且這些要求不會計入推論配額。
如果我有付費 API 帳戶,Google AI 工作室的資料會如何處理?
如要進一步瞭解啟用 Cloud 帳單時的資料處理方式,請參閱條款 (請參閱「付費服務」下方的「Google 如何使用您的資料」)。請注意,只要至少有 1 個 API 專案已啟用帳單功能,Google AI Studio 提示就會視為適用於相同的「付費服務」條款,如果您在「方案」下方看到任何標示為「付費」的專案,即可在 Gemini API 金鑰頁面驗證。
我可以在哪裡取得帳單相關協助?
如需帳單相關說明,請參閱「取得 Cloud Billing 支援」。