レート制限は、特定の期間内に Gemini API に対して実行できるリクエストの数を制御します。これらの上限は、公正な使用を保証し、不正使用を防止し、すべてのユーザーがシステム パフォーマンスを維持できるようにするためのものです。
レート制限の仕組み
レート制限は、次の 3 つのディメンションで測定されます。
- 1 分あたりのリクエスト数(RPM)
- 1 日あたりのリクエスト数(RPD)
- 1 分あたりのトークン数(TPM)
使用量は各上限に対して評価され、いずれかの上限を超えると、レート制限エラーが発生します。たとえば、RPM の上限が 20 の場合、1 分以内に 21 件のリクエストを実行すると、TPM などの上限を超えていない場合でもエラーが発生します。
レート制限は、API キーではなくプロジェクトごとに適用されます。
上限は、使用しているモデルによって異なり、一部の上限は特定のモデルにのみ適用されます。たとえば、1 分あたりの画像数(IPM)は、画像を生成できるモデル(Imagen 3)でのみ計算されますが、コンセプトは TPM に似ています。
使用量ティア
レート制限は、プロジェクトの使用状況階層(まもなくロールアウト予定)に関連付けられています。API の使用量と費用が増加すると、レート制限が引き上げられた上位の階層にアップグレードできます。
階層 | 要件 |
---|---|
無料 | 対象となる国のユーザー |
Tier 1 | プロジェクトにリンクされている請求先アカウント |
Tier 2 | 合計費用: 250 ドル以上 + 支払いが完了してから 30 日以上経過している |
Tier 3 | まだご利用いただけませんが、近日中にご利用いただけるようになります。 |
アップグレードをリクエストすると、Google の自動不正使用防止システムによって追加のチェックが行われます。通常、記載されている資格要件を満たしていれば承認されますが、審査プロセスで特定されたその他の要因に基づいて、アップグレード リクエストが拒否されることもあります。
このシステムは、すべてのユーザーにとって Gemini API プラットフォームのセキュリティと整合性を確保するのに役立ちます。
現在のレートの上限
モデル | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 15 | 1,000,000 | 1,500 |
Gemini 2.0 Flash Experimental | 10 | 1,000,000 | 1,500 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 1,500 |
Gemini 2.0 Pro 試験運用版 02-05 | 2 | 1,000,000 | 50 |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4,000,000 | 1,500 |
Gemini 1.5 Flash | 15 | 1,000,000 | 1,500 |
Gemini 1.5 Flash-8B | 15 | 1,000,000 | 1,500 |
Gemini 1.5 Pro | 2 | 32,000 | 50 |
Imagen 3 | -- | -- | -- |
Gemma 3 | 30 | 15,000 | 14,400 |
Gemini Embedding Experimental 03-07 | 5 | -- | 100 |
モデル | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 2,000 | 4,000,000 | -- |
Gemini 2.0 Flash Experimental | 10 | 4,000,000 | -- |
Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | -- |
Gemini 2.0 Pro 試験運用版 02-05 | 5 | 1,000,000 | -- |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4,000,000 | -- |
Gemini 1.5 Flash | 2,000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B | 4,000 | 4,000,000 | -- |
Gemini 1.5 Pro | 1,000 | 4,000,000 | -- |
Imagen 3 | -- | 1 分あたり 20 枚の画像(IPM) | -- |
Gemma 3 | -- | -- | -- |
Gemini Embedding Experimental 03-07 | 10 | -- | 1,000 |
モデル | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 10,000 | 10,000,000 | -- |
Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | -- |
Gemini 2.0 Pro 試験運用版 02-05 | 5 | 1,000,000 | -- |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4,000,000 | -- |
Gemini 1.5 Flash | 2,000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B | 4,000 | 4,000,000 | -- |
Gemini 1.5 Pro | 1,000 | 4,000,000 | -- |
Imagen 3 | -- | 1 分あたり 20 枚の画像(IPM) | -- |
Gemini Embedding Experimental 03-07 | 10 | -- | 1,000 |
指定されたレートの上限は保証されず、実際の容量は変動する可能性があります。
次の階層にアップグレードする方法
Gemini API は、すべての課金サービスに Cloud Billing を使用します。無料枠から有料枠に移行するには、まず Google Cloud プロジェクトで Cloud 課金を有効にする必要があります。
プロジェクトが指定された条件を満たすと、次の階層へのアップグレードの対象になります。アップグレードをリクエストする手順は次のとおりです。
- AI Studio の [API キー] ページに移動します。
- アップグレードするプロジェクトを見つけて、[アップグレード] をクリックします。[アップグレード] オプションは、次の階層の要件を満たすプロジェクトにのみ表示されます。
簡単な検証の後、プロジェクトは次の階層にアップグレードされます。
レート制限の引き上げをリクエストする
各モデルのバリエーションには、レート制限(1 分あたりのリクエスト数、RPM)が関連付けられています。これらのレート制限の詳細については、Gemini モデルをご覧ください。
レート制限の引き上げについて保証はいたしかねますが、リクエストを審査し、容量のニーズに対応できる場合はご連絡いたします。