レート上限は、特定の期間内に Gemini API に対して実行できるリクエストの数を規制します。これらの上限は、公平な使用を維持し、不正使用を防ぎ、すべてのユーザーのシステム パフォーマンスを維持するのに役立ちます。
レート制限の仕組み
通常、レート制限は次の 3 つのディメンションで測定されます。
- 1 分あたりのリクエスト数(RPM)
- 1 分あたりのトークン数(入力)(TPM)
- 1 日あたりのリクエスト数(RPD)
使用量は各上限に対して評価され、いずれかの上限を超えるとレート制限エラーがトリガーされます。たとえば、RPM の上限が 20 の場合、TPM や他の上限を超えていなくても、1 分以内に 21 回のリクエストを行うとエラーが発生します。
レート上限は API キーごとではなく、プロジェクトごとに適用されます。1 日あたりのリクエスト数(RPD)の割り当ては、太平洋時間の午前 0 時にリセットされます。
上限は使用する特定のモデルによって異なり、一部の上限は特定のモデルにのみ適用されます。たとえば、1 分あたりの画像数(IPM)は、画像を生成できるモデル(Nano Banana)でのみ計算されますが、概念的には TPM と似ています。他のモデルには、1 日あたりのトークン数(TPD)の上限が設定されている場合があります。
試験運用版モデルとプレビュー版モデルでは、レート制限が厳しくなっています。
費用ベースのレート上限
Gemini API では、1 分あたりのリクエスト数(RPM)と 1 分あたりのトークン数(TPM)の上限に加えて、予期しない料金が発生しないように、費用ベースのレート制限が適用されます。これらの上限がアカウントに適用されるかどうかは、請求履歴と使用量階層によって異なります。
次の表に、各使用量階層の費用ベースのレート制限を示します。これらの上限は、10 分間のローリング ウィンドウで評価されます。これらの上限がアカウントに適用されるかどうかは、請求履歴とアカウントのステータスによって異なります。
| 使用量ティア | 費用の上限(10 分あたり) |
|---|---|
| 無料 | なし |
| Tier 1 | $10 |
| Tier 2 | $200 |
| Tier 3 | $200 |
費用ベースのレート制限に達すると、API は 429 RESOURCE_EXHAUSTED エラーを返します。この問題を解決するには:
- しばらく待ってから再試行します。
- 高コストのリクエストのレートを下げる。たとえば、コンテキスト ウィンドウを小さくしたり、出力を短くしたりします。
- 通常の使用でこの上限に達することが頻繁に発生する場合は、レート上限の引き上げをリクエストしてください。
使用量ティア
レート上限は、プロジェクトの使用量階層に関連付けられています。API の使用量と費用が増加すると、レート制限が増加した上位のティアに自動的にアップグレードされます。
ティア 2 とティア 3 の資格は、プロジェクトにリンクされた請求先アカウントの Google Cloud サービス(Gemini API 以下を含みます(ただしこれらに限定されません))の合計累積費用に基づきます。
| 使用量ティア | 予選 | 課金ティアの上限 |
|---|---|---|
| 無料 | 有効なプロジェクトまたは無料トライアル | なし |
| Tier 1 | 有効な請求先アカウントを設定してリンクしている | $250 |
| Tier 2 | $100 のお支払い + 最初のお支払いが完了してから 3 日 | $2,000 |
| Tier 3 | $1,000 のお支払い + 最初のお支払いが完了してから 30 日 | $20,000 ~$100,000 以上 |
通常、上記の認定条件を満たしていればアップグレードは承認されますが、審査プロセスで特定された他の要因に基づいて、アップグレード リクエストが拒否されることもまれにあります。
このシステムは、すべてのユーザーに対して Gemini API プラットフォームのセキュリティと完全性を維持するのに役立ちます。
Gemini API のレート上限
レート上限は、さまざまな要因(使用量ティアなど)によって異なります。Google AI Studio で確認できます。階層とアカウントのステータスは時間の経過とともに変化するため、レート制限は自動的に更新されます。
指定されたレート上限は保証されず、実際の容量は変動する可能性があります。
優先度推論のレート上限
優先度の消費量は、全体的なインタラクティブ トラフィックのレート制限にカウントされますが、独自のレート制限が維持されます。デフォルトのレート上限は、各モデルとティアの標準レート上限の 0.3 倍です。
Batch API のレート上限
Batch API リクエストには、バッチ処理以外の API 呼び出しとは別のレート制限が適用されます。
- 同時実行バッチ リクエスト: 100
- 入力ファイルサイズの上限: 2 GB
- ファイル保存容量の上限: 20 GB
- モデルあたりのキュー登録済みトークン: バッチ キュー登録済みトークンの表には、特定のモデルのアクティブなバッチジョブ全体でバッチ処理用にキュー登録できるトークンの最大数が示されています。
Tier 1
| モデル | キューに追加できるバッチトークン | |||
|---|---|---|---|---|
| テキスト出力モデル | ||||
| Gemini 3.1 Pro プレビュー版 | 5,000,000 | |||
| Gemini 3.1 Flash-Lite | 10,000,000 | |||
| Gemini 3.1 Flash-Lite プレビュー版 | 10,000,000 | |||
| Gemini 3.5 Flash | 3,000,000 | |||
| Gemini 3.5 Flash | 3,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Gemini 2.5 Pro TTS | 25,000 | |||
| Gemini 2.5 Flash | 3,000,000 | |||
| Gemini 2.5 Flash プレビュー版 | 3,000,000 | |||
| Gemini 2.5 Flash Image プレビュー | 3,000,000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.5 Flash-Lite プレビュー版 | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| Gemini 2.0 Flash Image | 3,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| マルチモーダル生成モデル | ||||
| Gemini 3.1 Flash 画像プレビュー 🍌 | 1,000,000 | |||
| Gemini 3 Pro Image プレビュー 🍌 | 2,000,000 | |||
| エンベディング モデル | ||||
| Gemini エンベディング | 500,000 | |||
Tier 2
| モデル | キューに追加できるバッチトークン | |||
|---|---|---|---|---|
| テキスト出力モデル | ||||
| Gemini 3.1 Pro プレビュー版 | 500,000,000 | |||
| Gemini 3.1 Flash-Lite | 500,000,000 | |||
| Gemini 3.1 Flash-Lite プレビュー版 | 500,000,000 | |||
| Gemini 3.5 Flash | 400,000,000 | |||
| Gemini 3.5 Flash | 400,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Gemini 2.5 Pro TTS | 100,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash プレビュー版 | 400,000,000 | |||
| Gemini 2.5 Flash Image プレビュー | 400,000,000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.5 Flash-Lite プレビュー版 | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash Image | 400,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| マルチモーダル生成モデル | ||||
| Gemini 3.1 Flash 画像プレビュー 🍌 | 250,000,000 | |||
| Gemini 3 Pro Image プレビュー 🍌 | 270,000,000 | |||
| エンベディング モデル | ||||
| Gemini エンベディング | 5,000,000 | |||
Tier 3
| モデル | キューに追加できるバッチトークン | |||
|---|---|---|---|---|
| テキスト出力モデル | ||||
| Gemini 3.1 Pro プレビュー版 | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite プレビュー版 | 1,000,000,000 | |||
| Gemini 3.5 Flash | 1,000,000,000 | |||
| Gemini 3.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Gemini 2.5 Pro TTS | 1,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash プレビュー版 | 1,000,000,000 | |||
| Gemini 2.5 Flash Image プレビュー | 1,000,000,000 | |||
| Gemini 2.5 Flash TTS | 4,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite プレビュー版 | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| Gemini 2.0 Flash Image | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| マルチモーダル生成モデル | ||||
| Gemini 3.1 Flash 画像プレビュー 🍌 | 750,000,000 | |||
| Gemini 3 Pro Image プレビュー 🍌 | 1,000,000,000 | |||
| エンベディング モデル | ||||
| Gemini エンベディング | 10,000,000 | |||
次のティアにアップグレードする方法
無料枠から有料枠に移行するには、まず AI Studio で課金を設定する必要があります。
プロジェクトが指定された条件を満たすと、自動的に次の階層にアップグレードされます。無料枠から Tier 1 への階層アップグレードは通常、すぐに有効になります。それ以降の階層アップグレードは 10 分以内に有効になります。AI Studio のプロジェクト ページに移動して、ティアを確認します。
レート上限の引き上げをリクエストする
各モデル バリエーションには、関連付けられたレート制限(1 分あたりのリクエスト数、RPM)があります。これらのレート上限の詳細については、AI Studio のレート上限のページをご覧ください。
レート上限の引き上げは保証されませんが、リクエストの審査に最善を尽くします。