レート制限

レート制限は、特定の期間内に Gemini API に送信できるリクエスト数を規制します。この制限は、公正な使用を維持し、不正使用を防ぎ、すべてのユーザーのシステム パフォーマンスを維持するのに役立ちます。

AI Studio で有効なレート制限を表示する

レート制限の仕組み

レート制限は通常、次の 3 つのディメンションで測定されます。

  • 1 分あたりのリクエスト数(RPM
  • 1 分あたりのトークン数(入力)(TPM
  • 1 日あたりのリクエスト数(RPD

使用量は各上限に対して評価され、いずれかの上限を超えるとレート制限エラーがトリガーされます。たとえば、RPM 上限が 20 の場合、TPM やその他の上限を超えていなくても、1 分以内に 21 件のリクエストを行うとエラーが発生します。

レート制限は、API キーごとではなく、プロジェクトごとに適用されます。1 日あたりのリクエスト数(RPD)の割り当ては、午前 0 時(太平洋時間)にリセットされます。

上限は使用する特定のモデルによって異なり、一部の上限は特定のモデルにのみ適用されます。たとえば、1 分あたりの画像数(IPM)は、画像を生成できるモデル(Nano Banana)でのみ計算されますが、概念的には TPM と似ています。他のモデルでは、1 日あたりのトークン数(TPD)の上限が設定されている場合があります。

試験運用版モデルとプレビュー版モデルでは、レート制限が厳しくなっています。

費用ベースのレート制限

Gemini API では、1 分あたりのリクエスト数(RPM)と 1 分あたりのトークン数(TPM)の上限に加えて、予期しない料金が発生しないように費用ベースのレート制限が適用されます。これらの制限がアカウントに適用されるかどうかは、請求 履歴と使用量ティアによって異なります。

次の表に、使用量ティアごとの費用ベースのレート制限を示します。これらの制限は、10 分間のローリング ウィンドウで評価されます。これらの制限がアカウントに適用されるかどうかは、請求履歴とアカウントのステータスによって異なります。

使用量ティア 費用レート制限(10 分あたり)
無料 なし
Tier 1 $10
Tier 2 $200
Tier 3 $200

費用ベースのレート制限に達すると、API から 429 RESOURCE_EXHAUSTED エラーが返されます。この問題を解決するには:

  • しばらく待ってから再試行 してください。
  • コンテキスト ウィンドウを小さくしたり、出力を短くしたりするなどして、コストの高いリクエストのレートを減らします
  • 通常の使用中にこの上限に達することが続く場合は、 レート制限の引き上げをリクエストしてください

使用量ティア

レート制限は、プロジェクトの使用量ティアに関連付けられています。API の使用量と費用が増加すると、レート制限が引き上げられた上位のティアに自動的にアップグレードされます。

Tier 2 と Tier 3 の資格は、プロジェクトにリンクされている請求先アカウントの Google Cloud サービス(Gemini API を含むがこれに限定されない)の合計累積費用に基づいています。

使用量ティア 予選 請求ティアの上限
無料 有効なプロジェクトまたは無料トライアル なし
Tier 1 有効な請求先アカウントを設定してリンクしている $250
Tier 2 $100 の支払い + 最初のお支払いが完了してから 3 日 $2,000
Tier 3 $1,000 の支払い + 最初のお支払いが完了してから 30 日 $20,000 ~$100,000 以上

通常、記載されている資格要件を満たしていれば承認されますが、審査プロセスで特定された他の要因に基づいて、アップグレード リクエストが拒否される場合があります。

このシステムは、すべてのユーザーに対して Gemini API プラットフォームのセキュリティと整合性を維持するのに役立ちます。

Gemini API のレート制限

レート制限は、使用量ティアなどのさまざまな要因によって異なり、Google AI Studio で確認できます。ティアとアカウントのステータスは時間の経過とともに変化するため、レート制限は自動的に更新されます。

AI Studio で有効なレート制限を表示する

指定されたレート制限は保証されておらず、実際の容量は異なる場合があります。

優先推論のレート制限

優先度の高い消費は、消費量が全体的なインタラクティブ トラフィックの レート制限にカウントされる場合でも、独自のレート 制限を保持します。デフォルトのレート制限は、モデルとティアごとに標準レート制限の 0.3 倍です

Batch API のレート制限

Batch API リクエストには、非バッチ API 呼び出しとは別に、独自のレート 制限が適用されます。

  • 同時実行バッチ リクエスト: 100
  • 入力ファイルサイズの制限: 2 GB
  • ファイル ストレージの上限: 20 GB
  • モデルごとにキューに登録されたトークン: [バッチ キューに登録されたトークン] 表に、特定のモデルのすべてのアクティブなバッチジョブでバッチ処理用にキューに登録できるトークンの最大数が表示されます。

Tier 1

モデル バッチ キューに登録されたトークン
テキスト出力モデル
Gemini 3.1 Pro プレビュー版 5,000,000
Gemini 3.1 Flash Lite 10,000,000
Gemini 3.1 Flash Lite プレビュー版 10,000,000
Gemini 3.5 Flash 3,000,000
Gemini 2.5 Pro 5,000,000
Gemini 2.5 Pro TTS 25,000
Gemini 2.5 Flash 3,000,000
Gemini 2.5 Flash プレビュー版 3,000,000
Gemini 2.5 Flash Image プレビュー版 3,000,000
Gemini 2.5 Flash TTS 100,000
Gemini 2.5 Flash Lite 10,000,000
Gemini 2.5 Flash Lite プレビュー版 10,000,000
Gemini 2.0 Flash 10,000,000
Gemini 2.0 Flash Image 3,000,000
Gemini 2.0 Flash Lite 10,000,000
マルチモーダル生成モデル
Gemini 3.1 Flash Image プレビュー版 🍌 1,000,000
Gemini 3.1 Flash Lite Image 🍌 2,000,000
Gemini 3 Pro Image プレビュー版 🍌 2,000,000
エンベディング モデル
Gemini エンベディング 500,000

Tier 2

モデル バッチ キューに登録されたトークン
テキスト出力モデル
Gemini 3.1 Pro プレビュー版 500,000,000
Gemini 3.1 Flash Lite 500,000,000
Gemini 3.1 Flash Lite プレビュー版 500,000,000
Gemini 3.5 Flash 400,000,000
Gemini 2.5 Pro 500,000,000
Gemini 2.5 Pro TTS 100,000
Gemini 2.5 Flash 400,000,000
Gemini 2.5 Flash プレビュー版 400,000,000
Gemini 2.5 Flash Image プレビュー版 400,000,000
Gemini 2.5 Flash TTS 100,000
Gemini 2.5 Flash Lite 500,000,000
Gemini 2.5 Flash Lite プレビュー版 500,000,000
Gemini 2.0 Flash 1,000,000,000
Gemini 2.0 Flash Image 400,000,000
Gemini 2.0 Flash Lite 1,000,000,000
マルチモーダル生成モデル
Gemini 3.1 Flash Image プレビュー版 🍌 250,000,000
Gemini 3.1 Flash Lite Image 🍌 270,000,000
Gemini 3 Pro Image プレビュー版 🍌 270,000,000
エンベディング モデル
Gemini エンベディング 5,000,000

Tier 3

モデル バッチ キューに登録されたトークン
テキスト出力モデル
Gemini 3.1 Pro プレビュー版 1,000,000,000
Gemini 3.1 Flash Lite 1,000,000,000
Gemini 3.1 Flash Lite プレビュー版 1,000,000,000
Gemini 3.5 Flash 1,000,000,000
Gemini 2.5 Pro 1,000,000,000
Gemini 2.5 Pro TTS 1,000,000
Gemini 2.5 Flash 1,000,000,000
Gemini 2.5 Flash プレビュー版 1,000,000,000
Gemini 2.5 Flash Image プレビュー版 1,000,000,000
Gemini 2.5 Flash TTS 4,000,000
Gemini 2.5 Flash Lite 1,000,000,000
Gemini 2.5 Flash Lite プレビュー版 1,000,000,000
Gemini 2.0 Flash 5,000,000,000
Gemini 2.0 Flash Image 1,000,000,000
Gemini 2.0 Flash Lite 5,000,000,000
マルチモーダル生成モデル
Gemini 3.1 Flash Image プレビュー版 🍌 750,000,000
Gemini 3.1 Flash Lite Image 🍌 1,000,000,000
Gemini 3 Pro Image プレビュー版 🍌 1,000,000,000
エンベディング モデル
Gemini エンベディング 10,000,000

次のティアにアップグレードする方法

無料ティアから有料ティアに移行するには、まず AI Studio で請求を設定する必要があります

プロジェクトが指定された条件を満たすと、 自動的に次のティアにアップグレードされます。無料ティアから Tier 1 へのティアのアップグレードは通常、すぐに有効になります。それ以降のティアのアップグレードは 10 分以内に有効になります。AI Studio の [プロジェクト] ページに移動して、ティアを確認します。

レート制限の引き上げをリクエストする

モデル バリエーションごとに、関連付けられたレート制限(1 分あたりのリクエスト数、RPM)があります。 これらのレート制限の詳細については、 AI Studio のレート制限のページをご覧ください。

有料ティアのレート制限の引き上げをリクエストする

レート制限の引き上げを保証するものではありませんが、リクエストの審査に最善を尽くします。