レート上限は、特定の期間内に Gemini API に送信できるリクエストの数を規制します。これらの上限は、公平な使用を維持し、不正使用を防ぎ、すべてのユーザーのシステム パフォーマンスを維持するのに役立ちます。
レート制限の仕組み
通常、レート制限は次の 3 つのディメンションで測定されます。
- 1 分あたりのリクエスト数(RPM)
- 1 分あたりのトークン数(入力)(TPM)
- 1 日あたりのリクエスト数(RPD)
使用量は各上限に対して評価され、いずれかの上限を超えるとレート制限エラーがトリガーされます。たとえば、RPM 上限が 20 の場合、TPM や他の上限を超えていなくても、1 分以内に 21 回のリクエストを行うとエラーが発生します。
レート上限は API キーごとではなく、プロジェクトごとに適用されます。1 日あたりのリクエスト数(RPD)の割り当ては、太平洋時間の午前 0 時にリセットされます。
上限は使用する特定のモデルによって異なり、一部の上限は特定のモデルにのみ適用されます。たとえば、1 分あたりの画像数(IPM)は、画像を生成できるモデル(Imagen 3)に対してのみ計算されますが、概念的には TPM と似ています。他のモデルには、1 日あたりのトークン数(TPD)の上限が設定されている場合があります。
試験運用版モデルとプレビュー版モデルでは、レート制限がより厳しくなります。
使用量ティア
レート上限は、プロジェクトの使用量階層に関連付けられています。API の使用量と費用が増加すると、レート制限が引き上げられた上位の階層にアップグレードできるようになります。
Tier 2 と Tier 3 の資格は、プロジェクトにリンクされた請求先アカウントの Google Cloud サービス(Gemini API を含むがこれに限定されない)の合計累積費用に基づきます。
| 階層 | 要件 |
|---|---|
| 無料 | 対象となる国のユーザー |
| Tier 1 | プロジェクトにリンクされている有料の請求先アカウント |
| Tier 2 | 合計費用: $250 超、支払いが完了してから 30 日以上経過している |
| Tier 3 | 合計費用: $1,000 超、支払い完了から 30 日以上経過している |
アップグレードをリクエストすると、自動化された不正使用防止システムによって追加のチェックが実行されます。通常、上記の資格要件を満たしていれば承認されますが、審査プロセスで特定された他の要因に基づいて、アップグレード リクエストが拒否されることもまれにあります。
このシステムは、すべてのユーザーに対して Gemini API プラットフォームのセキュリティと完全性を維持するのに役立ちます。
Gemini API のレート上限
レート上限は、割り当て階層などのさまざまな要因によって異なります。Google AI Studio で確認できます。階層とアカウントのステータスは時間の経過とともに変化するため、レート制限は自動的に更新されます。
指定されたレート上限は保証されず、実際の容量は異なる場合があります。
Batch API のレート制限
Batch API リクエストには、バッチ処理以外の API 呼び出しとは別のレート制限が適用されます。
- 同時実行バッチ リクエスト: 100
- 入力ファイルサイズの制限: 2 GB
- ファイル保存容量の上限: 20 GB
- モデルあたりのキュー登録済みトークン: バッチ キュー登録済みトークンの表に、特定のモデルのアクティブなバッチジョブ全体でバッチ処理用にキュー登録できるトークンの最大数が示されています。
Tier 1
| モデル | バッチでキューに登録されたトークン | |||
|---|---|---|---|---|
| テキスト出力モデル | ||||
| Gemini 3 Pro プレビュー | 50,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Gemini 2.5 Flash | 3,000,000 | |||
| Gemini 2.5 Flash プレビュー | 3,000,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.5 Flash-Lite プレビュー | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| マルチモーダル生成モデル | ||||
| Gemini 3 Pro 画像プレビュー 🍌 | 2,000,000 | |||
Tier 2
| モデル | バッチでキューに登録されたトークン | |||
|---|---|---|---|---|
| テキスト出力モデル | ||||
| Gemini 3 Pro プレビュー | 500,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash プレビュー | 400,000,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.5 Flash-Lite プレビュー | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| マルチモーダル生成モデル | ||||
| Gemini 3 Pro 画像プレビュー 🍌 | 270,000,000 | |||
Tier 3
| モデル | バッチでキューに登録されたトークン | |||
|---|---|---|---|---|
| テキスト出力モデル | ||||
| Gemini 3 Pro プレビュー | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash プレビュー | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite プレビュー | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| マルチモーダル生成モデル | ||||
| Gemini 3 Pro 画像プレビュー 🍌 | 1,000,000,000 | |||
次の階層にアップグレードする方法
Gemini API は、すべての課金サービスに Cloud Billing を使用します。無料枠から有料枠に移行するには、まず Google Cloud プロジェクトで Cloud Billing を有効にする必要があります。
プロジェクトが指定された条件を満たすと、次の階層へのアップグレードの対象となります。アップグレードをリクエストする手順は次のとおりです。
- AI Studio の API キーのページに移動します。
- アップグレードするプロジェクトを見つけて、[アップグレード] をクリックします。[アップグレード] オプションは、次の階層の条件を満たすプロジェクトにのみ表示されます。
簡単な検証の後、プロジェクトは次の階層にアップグレードされます。
レート上限の引き上げをリクエストする
各モデル バリエーションには、関連付けられたレート制限(1 分あたりのリクエスト数、RPM)があります。これらのレート上限の詳細については、Gemini モデルをご覧ください。
レート上限の引き上げは保証できませんが、リクエストの審査に最善を尽くします。