レート上限は、特定の期間内に Gemini API に送信できるリクエストの数を規制します。これらの上限は、公平な使用を維持し、不正使用を防ぎ、すべてのユーザーのシステム パフォーマンスを維持するのに役立ちます。
レート制限の仕組み
通常、レート上限は次の 3 つのディメンションで測定されます。
- 1 分あたりのリクエスト数(RPM)
- 1 日あたりのリクエスト数(RPD)
- 1 分あたりのトークン数(入力)(TPM)
使用量は各上限に対して評価され、いずれかの上限を超えるとレート制限エラーがトリガーされます。たとえば、RPM 上限が 20 の場合、TPM や他の上限を超えていなくても、1 分以内に 21 回のリクエストを行うとエラーが発生します。
レート上限は API キーごとではなく、プロジェクトごとに適用されます。
上限は使用する特定のモデルによって異なり、一部の上限は特定のモデルにのみ適用されます。たとえば、1 分あたりの画像数(IPM)は、画像を生成できるモデル(Imagen 3)に対してのみ計算されますが、概念的には TPM と似ています。他のモデルには、1 日あたりのトークン数(TPD)の上限が設定されている場合があります。
試験運用版モデルとプレビュー版モデルでは、レート制限が厳しくなっています。
使用量ティア
レート上限は、プロジェクトの使用量階層に関連付けられています。API の使用量と費用が増加すると、レート上限が引き上げられた上位の階層にアップグレードできるようになります。
ティア 2 とティア 3 の条件は、プロジェクトにリンクされた請求先アカウントの Google Cloud サービス(Gemini API を含むがこれに限定されない)の合計累積費用に基づいています。
階層 | 要件 |
---|---|
無料 | 対象となる国のユーザー |
Tier 1 | プロジェクトにリンクされている請求先アカウント |
Tier 2 | 合計費用: $250 超、支払いが完了してから 30 日以上経過している |
Tier 3 | 合計費用: $1,000 超、支払い完了から 30 日以上経過している |
アップグレードをリクエストすると、自動化された不正使用防止システムによって追加のチェックが実行されます。通常、上記の認定条件を満たしていればアップグレードは承認されますが、審査プロセスで特定された他の要因に基づいて、アップグレード リクエストが拒否されることもまれにあります。
このシステムは、すべてのユーザーに対して Gemini API プラットフォームのセキュリティと完全性を維持するのに役立ちます。
標準 API のレート上限
次の表に、すべての標準 Gemini API 呼び出しのレート上限を示します。
無料枠
モデル | RPM | TPM | RPD |
---|---|---|---|
テキスト出力モデル | |||
Gemini 2.5 Pro | 5 | 250,000 | 100 |
Gemini 2.5 Flash | 10 | 250,000 | 250 |
Gemini 2.5 Flash-Lite プレビュー 06-17 | 15 | 250,000 | 1,000 |
Gemini 2.0 Flash | 15 | 1,000,000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
Live API | |||
Gemini 2.5 Flash Live | セッション数: 3 | 1,000,000 | |
Gemini 2.5 Flash プレビューのネイティブ音声ダイアログ | 1 回 | 25,000 | 5 |
Gemini 2.5 Flash Experimental ネイティブ音声思考ダイアログ | 1 回 | 10,000 | 5 |
Gemini 2.0 Flash Live | セッション数: 3 | 1,000,000 | |
マルチモーダル生成モデル | |||
Gemini 2.5 Flash プレビュー TTS | 3 | 10,000 | 15 |
Gemini 2.5 Pro プレビュー TTS | |||
Gemini 2.0 Flash プレビュー画像生成 | 10 | 200,000 | 100 |
Imagen 3 | |||
Veo 2 | |||
その他のモデル | |||
Gemma 3 および 3n | 30 | 15,000 | 14,400 |
Gemini エンベディング | 100 | 30,000 | 1,000 |
サポートが終了したモデル | |||
Gemini 1.5 Flash(非推奨) | 15 | 250,000 | 50 |
Gemini 1.5 Flash-8B(非推奨) | 15 | 250,000 | 50 |
Gemini 1.5 Pro(非推奨) |
Tier 1
モデル | RPM | TPM | RPD | バッチでキューに登録されたトークン |
---|---|---|---|---|
テキスト出力モデル | ||||
Gemini 2.5 Pro | 150 | 2,000,000 | 10,000 | 5,000,000 |
Gemini 2.5 Flash | 1,000 | 1,000,000 | 10,000 | 3,000,000 |
Gemini 2.5 Flash-Lite プレビュー 06-17 | 4,000 | 4,000,000 | ||
Gemini 2.0 Flash | 2,000 | 4,000,000 | 10,000,000 | |
Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | 10,000,000 | |
Live API | ||||
Gemini 2.5 Flash Live | 50 セッション | 4,000,000 | ||
Gemini 2.5 Flash プレビューのネイティブ音声ダイアログ | セッション数: 3 | 50,000 | 50 | |
Gemini 2.5 Flash Experimental ネイティブ音声思考ダイアログ | 1 回 | 25,000 | 50 | |
Gemini 2.0 Flash Live | 50 セッション | 4,000,000 | ||
マルチモーダル生成モデル | ||||
Gemini 2.5 Flash プレビュー TTS | 10 | 10,000 | 100 | |
Gemini 2.5 Pro プレビュー TTS | 10 | 10,000 | 50 | |
Gemini 2.0 Flash プレビュー画像生成 | 1,000 | 1,000,000 | 10,000 | |
Imagen 4 Standard | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Imagen 3 | 20 | |||
Veo 3 | 2 | 10 | ||
Veo 2 | 2 | 50 | ||
その他のモデル | ||||
Gemma 3 および 3n | 30 | 15,000 | 14,400 | |
Gemini エンベディング | 1,000 | 100,000 | 10,000 | |
サポートが終了したモデル | ||||
Gemini 1.5 Flash(非推奨) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B(非推奨) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro(非推奨) | 1,000 | 4,000,000 |
Tier 2
モデル | RPM | TPM | RPD | バッチでキューに登録されたトークン |
---|---|---|---|---|
テキスト出力モデル | ||||
Gemini 2.5 Pro | 1,000 | 5,000,000 | 50,000 | 500,000,000 |
Gemini 2.5 Flash | 2,000 | 3,000,000 | 100,000 | 400,000,000 |
Gemini 2.5 Flash-Lite プレビュー 06-17 | 10,000 | 10,000,000 | 100,000 | |
Gemini 2.0 Flash | 10,000 | 10,000,000 | 1,000,000,000 | |
Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | 1,000,000,000 | |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 セッション | 10,000,000 | ||
Gemini 2.5 Flash プレビューのネイティブ音声ダイアログ | 100 セッション | 1,000,000 | ||
Gemini 2.5 Flash Experimental ネイティブ音声思考ダイアログ | 1 回 | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 セッション | 10,000,000 | ||
マルチモーダル生成モデル | ||||
Gemini 2.5 Flash プレビュー TTS | 1,000 | 100,000 | 10,000 | |
Gemini 2.5 Pro プレビュー TTS | 100 | 25,000 | 1,000 | |
Gemini 2.0 Flash プレビュー画像生成 | 2,000 | 3,000,000 | 100,000 | |
Imagen 4 Standard | 15 | 1000 | ||
Imagen 4 Ultra | 10 | 400 | ||
Imagen 3 | 20 | |||
Veo 3 | 4 | 50 | ||
Veo 2 | 2 | 50 | ||
その他のモデル | ||||
Gemma 3 および 3n | 30 | 15,000 | 14,400 | |
Gemini エンベディング | 5,000 | 500,000 | -- | -- |
サポートが終了したモデル | ||||
Gemini 1.5 Flash(非推奨) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B(非推奨) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro(非推奨) | 1,000 | 4,000,000 |
Tier 3
モデル | RPM | TPM | RPD | バッチでキューに登録されたトークン |
---|---|---|---|---|
テキスト出力モデル | ||||
Gemini 2.5 Pro | 2,000 | 8,000,000 | 1,000,000,000 | |
Gemini 2.5 Flash | 10,000 | 8,000,000 | 1,000,000,000 | |
Gemini 2.5 Flash-Lite プレビュー 06-17 | 30,000 | 30,000,000 | ||
Gemini 2.0 Flash | 30,000 | 30,000,000 | 5,000,000,000 | |
Gemini 2.0 Flash-Lite | 30,000 | 30,000,000 | 5,000,000,000 | |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 セッション | 10,000,000 | ||
Gemini 2.5 Flash プレビューのネイティブ音声ダイアログ | 100 セッション | 1,000,000 | ||
Gemini 2.5 Flash Experimental ネイティブ音声思考ダイアログ | 1 回 | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 セッション | 10,000,000 | ||
マルチモーダル生成モデル | ||||
Gemini 2.5 Flash プレビュー TTS | 1,000 | 1,000,000 | ||
Gemini 2.5 Pro プレビュー TTS | 100 | 1,000,000 | ||
Gemini 2.0 Flash プレビュー画像生成 | 5,000 | 5,000,000 | ||
Imagen 4 Standard | 20 | 15,000 | ||
Imagen 4 Ultra | 15 | 5,000 | ||
Imagen 3 | 20 | |||
Veo 3 | 10 | 500 | ||
Veo 2 | 2 | 50 | ||
その他のモデル | ||||
Gemma 3 および 3n | 30 | 15,000 | 14,400 | |
Gemini エンベディング | 10,000 | 1,000,000 | -- | -- |
サポートが終了したモデル | ||||
Gemini 1.5 Flash(非推奨) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B(非推奨) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro(非推奨) | 1,000 | 4,000,000 |
指定されたレート上限は保証されず、実際の容量は異なる場合があります。
バッチモードのレート上限
バッチモードのリクエストには、非バッチモードの API 呼び出しとは別のレート上限が適用されます。
- 同時バッチ リクエスト: 100
- 入力ファイルサイズの上限: 2 GB
- ファイル保存容量の上限: 20 GB
- モデルあたりのキュー登録済みトークン: 次の表に、特定のモデルのアクティブなバッチジョブ全体でバッチ処理用にキュー登録できるトークンの最大数を示します。
次の階層にアップグレードする方法
Gemini API は、すべての課金サービスに Cloud Billing を使用します。無料枠から有料枠に移行するには、まず Google Cloud プロジェクトで Cloud Billing を有効にする必要があります。
プロジェクトが指定された条件を満たすと、次の階層へのアップグレードの対象となります。アップグレードをリクエストする手順は次のとおりです。
- AI Studio の API キーのページに移動します。
- アップグレードするプロジェクトを見つけて、[アップグレード] をクリックします。[アップグレード] オプションは、次の階層の条件を満たすプロジェクトにのみ表示されます。
簡単な検証の後、プロジェクトは次の階層にアップグレードされます。
レート制限の引き上げをリクエストする
各モデル バリエーションには、関連するレート制限(1 分あたりのリクエスト数、RPM)があります。これらのレート制限の詳細については、Gemini モデルをご覧ください。
レート上限の引き上げは保証されませんが、リクエストの審査に最善を尽くします。