頻率限制會規範您在指定時間範圍內可向 Gemini API 發出的要求數量。這些限制有助於維持公平使用、防止濫用行為,並協助維持所有使用者的系統效能。
費率限制的運作方式
頻率限制通常會在三個面向進行評估:
- 每分鐘要求數 (RPM)
- 每日要求配額 (RPD)
- 每分鐘符記數 (輸入) (TPM)
系統會根據各項限制評估您的用量,如果超過任何限制,就會觸發速率限制錯誤。舉例來說,如果 RPM 上限為 20,在 1 分鐘內提出 21 項要求就會導致錯誤,即使您並未超過 TPM 或其他限制也一樣。
頻率限制適用於每個專案,而非每個 API 金鑰。
限制會因所使用的特定模型而異,且部分限制僅適用於特定模型。舉例來說,每分鐘圖片數 (IPM) 只會針對可產生圖片的模型 (Imagen 3) 計算,但概念上與每分鐘圖片數相似。其他模型可能會有每日符記上限 (TPV)。
實驗版和預先發布版模型的頻率限制會更加嚴格。
用量層級
頻率限制與專案的用量層級相關。隨著 API 用量和支出增加,您可以選擇升級至更高的級別,以便享有更高的頻率限制。
級別 | 資格條件 |
---|---|
免費 | 位於適用國家/地區的使用者 |
級別 1 | 與專案連結的帳單帳戶 |
級別 2 | 總消費金額:$250 美元以上,且成功付款至少 30 天 |
階層 3 | 總消費金額:超過 $1,000 美元,且成功付款至少 30 天 |
您提出升級要求後,我們的自動濫用行為防護系統會執行額外檢查。雖然符合上述資格條件通常就足以獲得核准,但在少數情況下,升級要求可能會因審查過程中發現的其他因素而遭到拒絕。
這套系統有助於為所有使用者維護 Gemini API 平台的安全性和完整性。
目前的費率限制
免費方案
模型 | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.5 Pro | -- | -- | -- |
Gemini 2.5 Flash | 10 | 250,000 | 250 |
Gemini 2.5 Flash-Lite 預先發布版 06-17 | 15 | 250,000 | 1,000 |
Gemini 2.5 Flash 預先發布版 TTS | 3 | 10,000 | 15 |
Gemini 2.5 Pro 預先發布版 TTS | -- | -- | -- |
Gemini 2.0 Flash | 15 | 1,000,000 | 200 |
Gemini 2.0 Flash 預覽圖片產生功能 | 10 | 200,000 | 100 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
Imagen 3 | -- | -- | -- |
Veo 2 | -- | -- | -- |
Gemini 1.5 Flash (已淘汰) | 15 | 250,000 | 50 |
Gemini 1.5 Flash-8B (已淘汰) | 15 | 250,000 | 50 |
Gemini 1.5 Pro (已淘汰) | -- | -- | -- |
Gemma 3 和 3n | 30 | 15,000 | 14,400 |
Gemini Embedding Experimental 03-07 | 5 | -- | 100 |
級別 1
模型 | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.5 Pro | 150 | 2,000,000 | 1,000 |
Gemini 2.5 Flash | 1,000 | 1,000,000 | 10,000 |
Gemini 2.5 Flash-Lite 預先發布版 06-17 | 4,000 | 4,000,000 | -- |
Gemini 2.5 Flash 預先發布版 TTS | 10 | 10,000 | 100 |
Gemini 2.5 Pro 預先發布版 TTS | 10 | 10,000 | 50 |
Gemini 2.0 Flash | 2,000 | 4,000,000 | -- |
Gemini 2.0 Flash 預覽圖片產生功能 | 1,000 | 1,000,000 | 10,000 |
Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | -- |
Imagen 3 | -- | 每分鐘 20 張圖片 (IPM) | -- |
Veo 2 | 每分鐘 2 部影片 (VPM) | -- | 每日 50 部影片 (VPD) |
Gemini 1.5 Flash (已淘汰) | 2,000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B (已淘汰) | 4,000 | 4,000,000 | -- |
Gemini 1.5 Pro (已淘汰) | 1,000 | 4,000,000 | -- |
Gemma 3 和 3n | 30 | 15,000 | 14,400 |
Gemini Embedding Experimental 03-07 | 10 | -- | 1,000 |
級別 2
模型 | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.5 Pro | 1,000 | 5,000,000 | 50,000 次 |
Gemini 2.5 Flash | 2,000 | 3,000,000 | 100,000 |
Gemini 2.5 Flash-Lite 預先發布版 06-17 | 10,000 | 10,000,000 | 100,000 |
Gemini 2.5 Flash 預先發布版 TTS | 1,000 | 100,000 | 10,000 |
Gemini 2.5 Pro 預先發布版 TTS | 100 | 25,000 | 1,000 |
Gemini 2.0 Flash | 10,000 | 10,000,000 | -- |
Gemini 2.0 Flash 預覽圖片產生功能 | 2,000 | 3,000,000 | 100,000 |
Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | -- |
Imagen 3 | -- | 每分鐘 20 張圖片 (IPM) | -- |
Veo 2 | 每分鐘 2 部影片 (VPM) | -- | 每日 50 部影片 (VPD) |
Gemini 1.5 Flash (已淘汰) | 2,000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B (已淘汰) | 4,000 | 4,000,000 | -- |
Gemini 1.5 Pro (已淘汰) | 1,000 | 4,000,000 | -- |
Gemma 3 和 3n | 30 | 15,000 | 14,400 |
Gemini Embedding Experimental 03-07 | 10 | -- | 1,000 |
階層 3
模型 | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.5 Pro | 2,000 | 8,000,000 | -- |
Gemini 2.5 Flash | 10,000 | 8,000,000 | -- |
Gemini 2.5 Flash-Lite 預先發布版 06-17 | 30,000 | 30,000,000 | -- |
Gemini 2.5 Flash 預先發布版 TTS | 1,000 | 1,000,000 | -- |
Gemini 2.5 Pro 預先發布版 TTS | 100 | 1,000,000 | -- |
Gemini 2.0 Flash | 30,000 | 30,000,000 | -- |
Gemini 2.0 Flash 預覽圖片產生功能 | 5,000 | 5,000,000 | -- |
Gemini 2.0 Flash-Lite | 30,000 | 30,000,000 | -- |
Imagen 3 | -- | 每分鐘 20 張圖片 (IPM) | -- |
Veo 2 | 每分鐘 2 部影片 (VPM) | -- | 每日 50 部影片 (VPD) |
Gemini 1.5 Flash (已淘汰) | 2,000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B (已淘汰) | 4,000 | 4,000,000 | -- |
Gemini 1.5 Pro (已淘汰) | 1,000 | 4,000,000 | -- |
Gemma 3 和 3n | 30 | 15,000 | 14,400 |
Gemini Embedding Experimental 03-07 | 10 | -- | 1,000 |
我們無法保證指定的速率限制,實際容量可能會有所不同。
Live API 頻率限制
免費方案
名稱 | 並行工作階段 | TPM | RPD |
---|---|---|---|
Gemini 2.5 Flash Live | 3 | 1,000,000 | -- |
Gemini 2.0 Flash Live | 3 | 1,000,000 | -- |
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 | 1 | 25,000 | 5 |
Gemini 2.5 Flash Experimental 原生音訊思考對話方塊 | 1 | 10,000 | 5 |
級別 1
名稱 | 並行工作階段 | TPM | RPD |
---|---|---|---|
Gemini 2.5 Flash Live | 50 | 4,000,000 | -- |
Gemini 2.0 Flash Live | 50 | 4,000,000 | -- |
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 | 3 | 50,000 次 | 50 |
Gemini 2.5 Flash Experimental 原生音訊思考對話方塊 | 1 | 25,000 | 50 |
級別 2
名稱 | 並行工作階段 | TPM | RPD |
---|---|---|---|
Gemini 2.5 Flash Live | 1000 | 10,000,000 | -- |
Gemini 2.0 Flash Live | 1000 | 10,000,000 | -- |
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 | 100 | 1,000,000 | 無限制 |
Gemini 2.5 Flash Experimental 原生音訊思考對話方塊 | -- | -- | -- |
階層 3
名稱 | 並行工作階段 | TPM | RPD |
---|---|---|---|
Gemini 2.5 Flash Live | 1000 | 10,000,000 | -- |
Gemini 2.0 Flash Live | 1000 | 10,000,000 | -- |
Gemini 2.5 Flash 預先發布版原生音訊對話方塊 | -- | -- | -- |
Gemini 2.5 Flash Experimental 原生音訊思考對話方塊 | -- | -- | -- |
我們無法保證指定的速率限制,實際容量可能會有所不同。
如何升級至下一層級
Gemini API 會使用 Cloud Billing 處理所有帳單服務。如要從免費方案改用付費方案,您必須先為 Google Cloud 專案啟用 Cloud Billing。
專案符合指定條件後,即可升級至下一級。如要申請升級,請按照下列步驟操作:
經過快速驗證後,專案就會升級至下一層級。
要求提高頻率限制
每個模型變化版本都有相關的頻率限制 (每分鐘要求數,RPM)。如要進一步瞭解這些頻率限制,請參閱 Gemini 模型。
我們無法保證一定會提高您的頻率限制,但我們會盡力審查您的要求,並在可滿足您的容量需求時與您聯絡。