Ratenlimits regeln die Anzahl der Anfragen, die Sie innerhalb eines bestimmten Zeitraums an die Gemini API senden können. Diese Limits tragen dazu bei, dass die Nutzung fair bleibt, schützen vor Missbrauch und sorgen dafür, dass die Systemleistung für alle Nutzer aufrechterhalten wird.
Aktive Ratenbeschränkungen in AI Studio ansehen
So funktionieren Ratenbegrenzungen
Ratenbegrenzungen werden in der Regel anhand von drei Dimensionen gemessen:
- Anfragen pro Minute (RPM)
- Tokens pro Minute (Eingabe) (TPM)
- Anfragen pro Tag (RPD)
Ihre Nutzung wird anhand der einzelnen Limits bewertet. Wenn Sie eines der Limits überschreiten, wird ein Ratenbegrenzungsfehler ausgelöst. Wenn Ihr RPM-Limit beispielsweise 20 beträgt, führt das Senden von 21 Anfragen innerhalb einer Minute zu einem Fehler, auch wenn Sie Ihr TPM-Limit oder andere Limits nicht überschritten haben.
Ratenbegrenzungen gelten pro Projekt, nicht pro API-Schlüssel. Kontingente für Anfragen pro Tag (RPD) werden um Mitternacht (Pacific Time) zurückgesetzt.
Die Limits variieren je nach verwendetem Modell. Einige Limits gelten nur für bestimmte Modelle. „Bilder pro Minute“ (Images per minute, IPM) wird beispielsweise nur für Modelle berechnet, die Bilder generieren können (Nano Banana), ist aber konzeptionell ähnlich wie TPM. Bei anderen Modellen gilt möglicherweise ein Tokenlimit pro Tag.
Die Ratenbegrenzungen für experimentelle Modelle und Vorschauversionen sind strenger.
Ausgabenbasierte Ratenlimits
Zusätzlich zu den Limits für Anfragen pro Minute (RPM) und Tokens pro Minute (TPM) erzwingt die Gemini API ausgabenbasierte Ratenbegrenzungen, um vor unerwarteten Gebühren zu schützen. Ob diese Limits für Ihr Konto gelten, hängt von Ihrem Abrechnungsverlauf und Ihrer Nutzungsebene ab.
In der folgenden Tabelle sind die ausgabenbasierten Ratenlimits für die einzelnen Nutzungsstufen aufgeführt. Diese Limits werden in einem gleitenden 10‑Minuten-Zeitraum ausgewertet. Ob diese Limits für Ihr Konto gelten, hängt von Ihrem Abrechnungsverlauf und dem Status Ihres Kontos ab.
| Nutzungsstufe | Ausgabelimit (pro 10 Minuten) |
|---|---|
| Kostenlos | – |
| Stufe 1 | 10 $ |
| Tier 2 | 200 $ |
| Stufe 3 | 200 $ |
Wenn Sie eine ausgabenbasierte Ratenbegrenzung erreichen, gibt die API einen 429 RESOURCE_EXHAUSTED-Fehler zurück. So beheben Sie dies:
- Warten Sie kurz und versuchen Sie es dann noch einmal.
- Reduzieren Sie die Rate teurer Anfragen, indem Sie beispielsweise kleinere Kontextfenster oder kürzere Ausgaben verwenden.
- Wenn Sie dieses Limit bei normaler Nutzung immer wieder erreichen, können Sie eine Erhöhung des Ratenlimits beantragen.
Nutzungsstufen
Ratenbegrenzungen sind an die Nutzungsebene des Projekts gebunden. Wenn Ihre API-Nutzung und Ihre Ausgaben steigen, werden Sie automatisch auf eine höhere Stufe mit höheren Ratenbegrenzungen hochgestuft.
Die Voraussetzungen für die Stufen 2 und 3 basieren auf den kumulativen Gesamtausgaben für Google Cloud-Dienste (einschließlich, aber nicht beschränkt auf die Gemini API) für das mit Ihrem Projekt verknüpfte Abrechnungskonto.
| Nutzungsstufe | Qualifikation | Obergrenze für Abrechnungsstufe |
|---|---|---|
| Kostenlos | Aktives Projekt oder kostenloser Testzeitraum | – |
| Stufe 1 | Aktives Rechnungskonto einrichten und verknüpfen | 250 $ |
| Tier 2 | 100 $ + 3 Tage seit erster eingegangener Zahlung | 2.000 $ |
| Stufe 3 | 1.000 $ bezahlt + 30 Tage seit erster erfolgreicher Zahlung | 20.000 $ bis 100.000 $ und mehr |
Die Erfüllung der angegebenen Qualifikationskriterien reicht in der Regel für die Genehmigung aus. In seltenen Fällen kann ein Antrag auf Upgrade jedoch aufgrund anderer Faktoren abgelehnt werden, die während der Überprüfung festgestellt wurden.
Dieses System trägt dazu bei, die Sicherheit und Integrität der Gemini API-Plattform für alle Nutzer aufrechtzuerhalten.
Ratenbegrenzungen für die Gemini API
Ratenbeschränkungen hängen von verschiedenen Faktoren ab, z. B. von Ihrer Nutzungsstufe, und können in Google AI Studio eingesehen werden. Wenn sich Ihr Tier und Ihr Kontostatus im Laufe der Zeit ändern, werden Ihre Ratenbegrenzungen automatisch aktualisiert.
Aktive Ratenbeschränkungen in AI Studio ansehen
Die angegebenen Ratenlimits sind nicht garantiert und die tatsächliche Kapazität kann variieren.
Ratenlimits für Prioritätsinferenz
Für die Nutzung von Priorität gelten eigene Ratenbeschränkungen, auch wenn die Nutzung auf die Ratenbeschränkungen für den gesamten interaktiven Traffic angerechnet wird. Die Standardratenbegrenzungen sind: 0,3-mal die Standardratenbegrenzung für jedes Modell und jede Stufe
Ratenlimits für die Batch API
Für Batch API-Anfragen gelten eigene Ratenlimits, die sich von denen für Nicht-Batch-API-Aufrufe unterscheiden.
- Gleichzeitige Batchanfragen:100
- Maximale Größe der Eingabedatei:2 GB
- Dateispeicherlimit:20 GB
- In die Warteschlange gestellte Tokens pro Modell:In der Tabelle In die Warteschlange gestellte Batch-Tokens wird die maximale Anzahl von Tokens aufgeführt, die für die Batchverarbeitung für alle Ihre aktiven Batchjobs für ein bestimmtes Modell in die Warteschlange gestellt werden können.
Preisstufe 1
| Modell | In die Warteschlange gestellte Batch-Tokens | |||
|---|---|---|---|---|
| Textausgabemodelle | ||||
| Gemini 3.1 Pro (Vorabversion) | 5.000.000 | |||
| Gemini 3.1 Flash Lite | 10.000.000 | |||
| Gemini 3.1 Flash-Lite (Vorabversion) | 10.000.000 | |||
| Gemini 3.5 Flash | 3.000.000 | |||
| Gemini 3.5 Flash | 3.000.000 | |||
| Gemini 2.5 Pro | 5.000.000 | |||
| Gemini 2.5 Pro TTS | 25.000 | |||
| Gemini 2.5 Flash | 3.000.000 | |||
| Gemini 2.5 Flash (Vorabversion) | 3.000.000 | |||
| Gemini 2.5 Flash Image (Vorabversion) | 3.000.000 | |||
| Gemini 2.5 Flash TTS | 100.000 | |||
| Gemini 2.5 Flash-Lite | 10.000.000 | |||
| Gemini 2.5 Flash-Lite (Vorabversion) | 10.000.000 | |||
| Gemini 2.0 Flash | 10.000.000 | |||
| Gemini 2.0 Flash Image | 3.000.000 | |||
| Gemini 2.0 Flash-Lite | 10.000.000 | |||
| Multimodale generative Modelle | ||||
| Gemini 3.1 Flash Image (Vorabversion) 🍌 | 1.000.000 | |||
| Gemini 3 Pro Image (Vorabversion) 🍌 | 2.000.000 | |||
| Einbettungsmodelle | ||||
| Gemini Embedding | 500.000 | |||
Preisstufe 2
| Modell | In die Warteschlange gestellte Batch-Tokens | |||
|---|---|---|---|---|
| Textausgabemodelle | ||||
| Gemini 3.1 Pro (Vorabversion) | 500.000.000 | |||
| Gemini 3.1 Flash Lite | 500.000.000 | |||
| Gemini 3.1 Flash-Lite (Vorabversion) | 500.000.000 | |||
| Gemini 3.5 Flash | 400.000.000 | |||
| Gemini 3.5 Flash | 400.000.000 | |||
| Gemini 2.5 Pro | 500.000.000 | |||
| Gemini 2.5 Pro TTS | 100.000 | |||
| Gemini 2.5 Flash | 400.000.000 | |||
| Gemini 2.5 Flash (Vorabversion) | 400.000.000 | |||
| Gemini 2.5 Flash Image (Vorabversion) | 400.000.000 | |||
| Gemini 2.5 Flash TTS | 100.000 | |||
| Gemini 2.5 Flash-Lite | 500.000.000 | |||
| Gemini 2.5 Flash-Lite (Vorabversion) | 500.000.000 | |||
| Gemini 2.0 Flash | 1.000.000.000 | |||
| Gemini 2.0 Flash Image | 400.000.000 | |||
| Gemini 2.0 Flash-Lite | 1.000.000.000 | |||
| Multimodale generative Modelle | ||||
| Gemini 3.1 Flash Image (Vorabversion) 🍌 | 250.000.000 | |||
| Gemini 3 Pro Image (Vorabversion) 🍌 | 270.000.000 | |||
| Einbettungsmodelle | ||||
| Gemini Embedding | 5.000.000 | |||
Ebene 3
| Modell | In die Warteschlange gestellte Batch-Tokens | |||
|---|---|---|---|---|
| Textausgabemodelle | ||||
| Gemini 3.1 Pro (Vorabversion) | 1.000.000.000 | |||
| Gemini 3.1 Flash Lite | 1.000.000.000 | |||
| Gemini 3.1 Flash-Lite (Vorabversion) | 1.000.000.000 | |||
| Gemini 3.5 Flash | 1.000.000.000 | |||
| Gemini 3.5 Flash | 1.000.000.000 | |||
| Gemini 2.5 Pro | 1.000.000.000 | |||
| Gemini 2.5 Pro TTS | 1.000.000 | |||
| Gemini 2.5 Flash | 1.000.000.000 | |||
| Gemini 2.5 Flash (Vorabversion) | 1.000.000.000 | |||
| Gemini 2.5 Flash Image (Vorabversion) | 1.000.000.000 | |||
| Gemini 2.5 Flash TTS | 4.000.000 | |||
| Gemini 2.5 Flash-Lite | 1.000.000.000 | |||
| Gemini 2.5 Flash-Lite (Vorabversion) | 1.000.000.000 | |||
| Gemini 2.0 Flash | 5.000.000.000 | |||
| Gemini 2.0 Flash Image | 1.000.000.000 | |||
| Gemini 2.0 Flash-Lite | 5.000.000.000 | |||
| Multimodale generative Modelle | ||||
| Gemini 3.1 Flash Image (Vorabversion) 🍌 | 750.000.000 | |||
| Gemini 3 Pro Image (Vorabversion) 🍌 | 1.000.000.000 | |||
| Einbettungsmodelle | ||||
| Gemini Embedding | 10.000.000 | |||
So führst du ein Upgrade auf die nächste Stufe durch
Wenn Sie von der kostenlosen Stufe zu einer kostenpflichtigen Stufe wechseln möchten, müssen Sie zuerst die Abrechnung in AI Studio einrichten.
Sobald Ihr Projekt die angegebenen Kriterien erfüllt, wird es automatisch auf die nächste Stufe hochgestuft. Tier-Upgrades von der kostenlosen Stufe auf Tier 1 werden in der Regel sofort wirksam. Nachfolgende Tier-Upgrades werden innerhalb von 10 Minuten wirksam. Rufen Sie die Seite „Projekte“ in AI Studio auf, um Ihre Stufen zu prüfen.
Erhöhung des Ratenlimits beantragen
Für jede Modellvariante gilt ein zugehöriges Ratenlimit (Anfragen pro Minute, RPM). Weitere Informationen zu diesen Ratenlimits finden Sie auf der Seite AI Studio-Ratenlimit.
Erhöhung der Anfragenbeschränkung für kostenpflichtige Stufe beantragen
Wir können nicht garantieren, dass Ihr Ratenlimit erhöht wird, werden aber unser Bestes tun, um Ihre Anfrage zu prüfen.