レート制限

レート上限は、特定の期間内に Gemini API に送信できるリクエストの数を規制します。これらの上限は、公平な使用を維持し、不正使用を防ぎ、すべてのユーザーのシステム パフォーマンスを維持するのに役立ちます。

レート制限の仕組み

通常、レート上限は次の 3 つのディメンションで測定されます。

  • 1 分あたりのリクエスト数(RPM
  • 1 日あたりのリクエスト数(RPD
  • 1 分あたりのトークン数(入力)(TPM

使用量は各上限に対して評価され、いずれかの上限を超えるとレート制限エラーがトリガーされます。たとえば、RPM 上限が 20 の場合、TPM や他の上限を超えていなくても、1 分以内に 21 回のリクエストを行うとエラーが発生します。

レート上限は API キーごとではなく、プロジェクトごとに適用されます。

上限は使用する特定のモデルによって異なり、一部の上限は特定のモデルにのみ適用されます。たとえば、1 分あたりの画像数(IPM)は、画像を生成できるモデル(Imagen 3)に対してのみ計算されますが、概念的には TPM と似ています。他のモデルには、1 日あたりのトークン数(TPD)の上限が設定されている場合があります。

試験運用版モデルとプレビュー版モデルでは、レート制限が厳しくなっています。

使用量ティア

レート上限は、プロジェクトの使用量階層に関連付けられています。API の使用量と費用が増加すると、レート上限が引き上げられた上位の階層にアップグレードできるようになります。

ティア 2 とティア 3 の条件は、プロジェクトにリンクされた請求先アカウントの Google Cloud サービス(Gemini API を含むがこれに限定されない)の合計累積費用に基づいています。

階層 要件
無料 対象となる国のユーザー
Tier 1 プロジェクトにリンクされている請求先アカウント
Tier 2 合計費用: $250 超、支払いが完了してから 30 日以上経過している
Tier 3 合計費用: $1,000 超、支払い完了から 30 日以上経過している

アップグレードをリクエストすると、自動化された不正使用防止システムによって追加のチェックが実行されます。通常、上記の認定条件を満たしていればアップグレードは承認されますが、審査プロセスで特定された他の要因に基づいて、アップグレード リクエストが拒否されることもまれにあります。

このシステムは、すべてのユーザーに対して Gemini API プラットフォームのセキュリティと完全性を維持するのに役立ちます。

標準 API のレート上限

次の表に、すべての標準 Gemini API 呼び出しのレート上限を示します。

無料枠

モデル RPM TPM RPD
テキスト出力モデル
Gemini 2.5 Pro 5 250,000 100
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash-Lite プレビュー 06-17 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live セッション数: 3 1,000,000
Gemini 2.5 Flash プレビューのネイティブ音声ダイアログ 1 回 25,000 5
Gemini 2.5 Flash Experimental ネイティブ音声思考ダイアログ 1 回 10,000 5
Gemini 2.0 Flash Live セッション数: 3 1,000,000
マルチモーダル生成モデル
Gemini 2.5 Flash プレビュー TTS 3 10,000 15
Gemini 2.5 Pro プレビュー TTS
Gemini 2.0 Flash プレビュー画像生成 10 200,000 100
Imagen 3
Veo 2
その他のモデル
Gemma 3 および 3n 30 15,000 14,400
Gemini エンベディング 100 30,000 1,000
サポートが終了したモデル
Gemini 1.5 Flash(非推奨) 15 250,000 50
Gemini 1.5 Flash-8B(非推奨) 15 250,000 50
Gemini 1.5 Pro(非推奨)

Tier 1

モデル RPM TPM RPD バッチでキューに登録されたトークン
テキスト出力モデル
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 3,000,000
Gemini 2.5 Flash-Lite プレビュー 06-17 4,000 4,000,000
Gemini 2.0 Flash 2,000 4,000,000 10,000,000
Gemini 2.0 Flash-Lite 4,000 4,000,000 10,000,000
Live API
Gemini 2.5 Flash Live 50 セッション 4,000,000
Gemini 2.5 Flash プレビューのネイティブ音声ダイアログ セッション数: 3 50,000 50
Gemini 2.5 Flash Experimental ネイティブ音声思考ダイアログ 1 回 25,000 50
Gemini 2.0 Flash Live 50 セッション 4,000,000
マルチモーダル生成モデル
Gemini 2.5 Flash プレビュー TTS 10 10,000 100
Gemini 2.5 Pro プレビュー TTS 10 10,000 50
Gemini 2.0 Flash プレビュー画像生成 1,000 1,000,000 10,000
Imagen 4 Standard 10 70
Imagen 4 Ultra 5 30
Imagen 3 20
Veo 3 2 10
Veo 2 2 50
その他のモデル
Gemma 3 および 3n 30 15,000 14,400
Gemini エンベディング 1,000 100,000 10,000
サポートが終了したモデル
Gemini 1.5 Flash(非推奨) 2,000 4,000,000
Gemini 1.5 Flash-8B(非推奨) 4,000 4,000,000
Gemini 1.5 Pro(非推奨) 1,000 4,000,000

Tier 2

モデル RPM TPM RPD バッチでキューに登録されたトークン
テキスト出力モデル
Gemini 2.5 Pro 1,000 5,000,000 50,000 500,000,000
Gemini 2.5 Flash 2,000 3,000,000 100,000 400,000,000
Gemini 2.5 Flash-Lite プレビュー 06-17 10,000 10,000,000 100,000
Gemini 2.0 Flash 10,000 10,000,000 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 1,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 セッション 10,000,000
Gemini 2.5 Flash プレビューのネイティブ音声ダイアログ 100 セッション 1,000,000
Gemini 2.5 Flash Experimental ネイティブ音声思考ダイアログ 1 回 25,000 50
Gemini 2.0 Flash Live 1,000 セッション 10,000,000
マルチモーダル生成モデル
Gemini 2.5 Flash プレビュー TTS 1,000 100,000 10,000
Gemini 2.5 Pro プレビュー TTS 100 25,000 1,000
Gemini 2.0 Flash プレビュー画像生成 2,000 3,000,000 100,000
Imagen 4 Standard 15 1000
Imagen 4 Ultra 10 400
Imagen 3 20
Veo 3 4 50
Veo 2 2 50
その他のモデル
Gemma 3 および 3n 30 15,000 14,400
Gemini エンベディング 5,000 500,000 -- --
サポートが終了したモデル
Gemini 1.5 Flash(非推奨) 2,000 4,000,000
Gemini 1.5 Flash-8B(非推奨) 4,000 4,000,000
Gemini 1.5 Pro(非推奨) 1,000 4,000,000

Tier 3

モデル RPM TPM RPD バッチでキューに登録されたトークン
テキスト出力モデル
Gemini 2.5 Pro 2,000 8,000,000 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 1,000,000,000
Gemini 2.5 Flash-Lite プレビュー 06-17 30,000 30,000,000
Gemini 2.0 Flash 30,000 30,000,000 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 30,000,000 5,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 セッション 10,000,000
Gemini 2.5 Flash プレビューのネイティブ音声ダイアログ 100 セッション 1,000,000
Gemini 2.5 Flash Experimental ネイティブ音声思考ダイアログ 1 回 25,000 50
Gemini 2.0 Flash Live 1,000 セッション 10,000,000
マルチモーダル生成モデル
Gemini 2.5 Flash プレビュー TTS 1,000 1,000,000
Gemini 2.5 Pro プレビュー TTS 100 1,000,000
Gemini 2.0 Flash プレビュー画像生成 5,000 5,000,000
Imagen 4 Standard 20 15,000
Imagen 4 Ultra 15 5,000
Imagen 3 20
Veo 3 10 500
Veo 2 2 50
その他のモデル
Gemma 3 および 3n 30 15,000 14,400
Gemini エンベディング 10,000 1,000,000 -- --
サポートが終了したモデル
Gemini 1.5 Flash(非推奨) 2,000 4,000,000
Gemini 1.5 Flash-8B(非推奨) 4,000 4,000,000
Gemini 1.5 Pro(非推奨) 1,000 4,000,000

指定されたレート上限は保証されず、実際の容量は異なる場合があります。

バッチモードのレート上限

バッチモードのリクエストには、非バッチモードの API 呼び出しとは別のレート上限が適用されます。

  • 同時バッチ リクエスト: 100
  • 入力ファイルサイズの上限: 2 GB
  • ファイル保存容量の上限: 20 GB
  • モデルあたりのキュー登録済みトークン: 次の表に、特定のモデルのアクティブなバッチジョブ全体でバッチ処理用にキュー登録できるトークンの最大数を示します。

次の階層にアップグレードする方法

Gemini API は、すべての課金サービスに Cloud Billing を使用します。無料枠から有料枠に移行するには、まず Google Cloud プロジェクトで Cloud Billing を有効にする必要があります。

プロジェクトが指定された条件を満たすと、次の階層へのアップグレードの対象となります。アップグレードをリクエストする手順は次のとおりです。

  • AI Studio の API キーのページに移動します。
  • アップグレードするプロジェクトを見つけて、[アップグレード] をクリックします。[アップグレード] オプションは、次の階層の条件を満たすプロジェクトにのみ表示されます。

簡単な検証の後、プロジェクトは次の階層にアップグレードされます。

レート制限の引き上げをリクエストする

各モデル バリエーションには、関連するレート制限(1 分あたりのリクエスト数、RPM)があります。これらのレート制限の詳細については、Gemini モデルをご覧ください。

有料階層のレート制限の引き上げをリクエストする

レート上限の引き上げは保証されませんが、リクエストの審査に最善を尽くします。