Ratenbegrenzungen regeln die Anzahl der Anfragen, die Sie innerhalb eines bestimmten Zeitraums an die Gemini API senden können. Diese Limits tragen dazu bei, eine faire Nutzung zu gewährleisten, vor Missbrauch zu schützen und die Systemleistung für alle Nutzer aufrechtzuerhalten.
Aktive Ratenbegrenzungen in AI Studio ansehen
So funktionieren Ratenbegrenzungen
Ratenbegrenzungen werden in der Regel anhand von drei Dimensionen gemessen:
- Anfragen pro Minute (RPM)
- Tokens pro Minute (Eingabe) (TPM)
- Anfragen pro Tag (RPD)
Ihre Nutzung wird mit jedem Limit verglichen. Wenn Sie eines der Limits überschreiten, wird ein Fehler aufgrund der Ratenbegrenzung ausgelöst. Wenn Ihr RPM-Limit beispielsweise 20 beträgt, führt das Senden von 21 Anfragen innerhalb einer Minute zu einem Fehler, auch wenn Sie Ihr TPM-Limit oder andere Limits nicht überschritten haben.
Ratenbegrenzungen werden pro Projekt und nicht pro API-Schlüssel angewendet. Kontingente für Anfragen pro Tag (RPD) werden um Mitternacht (Pacific Time) zurückgesetzt.
Die Limits variieren je nach verwendetem Modell. Einige Limits gelten nur für bestimmte Modelle. Die Anzahl der Bilder pro Minute (Images per minute, IPM) wird beispielsweise nur für Modelle berechnet, die Bilder generieren können (Nano Banana). Das Konzept ist jedoch ähnlich wie bei TPM. Für andere Modelle gilt möglicherweise ein Limit für Tokens pro Tag (Tokens per day, TPD).
Für experimentelle Modelle und Modelle in der Vorabversion gelten strengere Ratenbegrenzungen.
Nutzungsstufen
Ratenbegrenzungen sind an die Nutzungsstufe des Projekts gebunden. Wenn Ihre API-Nutzung und Ihre Ausgaben steigen, werden Sie automatisch auf eine höhere Stufe mit höheren Ratenbegrenzungen hochgestuft.
Die Voraussetzungen für die Stufen 2 und 3 basieren auf den kumulativen Gesamtausgaben für Google Cloud-Dienste (einschließlich, aber nicht beschränkt auf die Gemini API) für das mit Ihrem Projekt verknüpfte Rechnungskonto.
| Nutzungsstufe | Voraussetzung | Obergrenze für die Abrechnungsstufe |
|---|---|---|
| Kostenlos | Aktives Projekt oder kostenlose Testversion | – |
| Stufe 1 | Aktives Rechnungskonto einrichten und verknüpfen | 250 $ |
| Stufe 2 | 100 $bezahlt + 3 Tage seit der ersten erfolgreichen Zahlung | 2.000 $ |
| Stufe 3 | 1.000 $bezahlt + 30 Tage seit der ersten erfolgreichen Zahlung | 20.000 $ bis 100.000 $+ |
Die Erfüllung der angegebenen Voraussetzungen reicht in der Regel für die Genehmigung aus. In seltenen Fällen kann eine Anfrage zur Hochstufung jedoch aufgrund anderer Faktoren abgelehnt werden, die während der Überprüfung ermittelt wurden.
Dieses System trägt dazu bei, die Sicherheit und Integrität der Gemini API-Plattform für alle Nutzer aufrechtzuerhalten.
Gemini API – Ratenbegrenzungen
Die Ratenbegrenzungen hängen von verschiedenen Faktoren ab (z. B. von Ihrer Nutzungsstufe) und können in Google AI Studio eingesehen werden. Wenn sich Ihre Stufe und Ihr Kontostatus im Laufe der Zeit ändern, werden Ihre Ratenbegrenzungen automatisch aktualisiert.
Aktive Ratenbegrenzungen in AI Studio ansehen
Die angegebenen Ratenbegrenzungen sind nicht garantiert und die tatsächliche Kapazität kann variieren.
Ratenbegrenzungen für die Prioritätsinferenz
Prioritätsnutzung gelten eigene Raten begrenzungen, auch wenn die Nutzung auf die allgemeinen Ratenbegrenzungen für interaktiven Traffic angerechnet wird. Standardratenbegrenzungen: 0,3-fache der Standardratenbegrenzung für jedes Modell und jede Stufe
Ratenbegrenzungen für Batch-APIs
Batch-API-Anfragen unterliegen eigenen Raten begrenzungen, die von den Ratenbegrenzungen für API-Aufrufe ohne Batchverarbeitung getrennt sind.
- Gleichzeitige Batchanfragen:100
- Limit für die Eingabedateigröße:2 GB
- Limit für den Dateispeicher:20 GB
- In die Warteschlange gestellte Tokens pro Modell:In der Tabelle In die Warteschlange gestellte Batch-Tokens ist die maximale Anzahl von Tokens aufgeführt, die für die Batchverarbeitung für alle aktiven Batchjobs für ein bestimmtes Modell in die Warteschlange gestellt werden können.
Stufe 1
| Modell | In die Warteschlange gestellte Batch-Tokens | |||
|---|---|---|---|---|
| Textausgabemodelle | ||||
| Gemini 3.1 Pro (Vorabversion) | 5.000.000 | |||
| Gemini 3.1 Flash-Lite (Vorabversion) | 10.000.000 | |||
| Gemini 3 Flash (Vorabversion) | 3.000.000 | |||
| Gemini 2.5 Pro | 5.000.000 | |||
| Gemini 2.5 Pro TTS | 25.000 | |||
| Gemini 2.5 Flash | 3.000.000 | |||
| Gemini 2.5 Flash (Vorabversion) | 3.000.000 | |||
| Gemini 2.5 Flash Image (Vorabversion) | 3.000.000 | |||
| Gemini 2.5 Flash TTS | 100.000 | |||
| Gemini 2.5 Flash-Lite | 10.000.000 | |||
| Gemini 2.5 Flash-Lite (Vorabversion) | 10.000.000 | |||
| Gemini 2.0 Flash | 10.000.000 | |||
| Gemini 2.0 Flash Image | 3.000.000 | |||
| Gemini 2.0 Flash-Lite | 10.000.000 | |||
| Multimodale Generierungsmodelle | ||||
| Gemini 3.1 Flash Image (Vorabversion) 🍌 | 1.000.000 | |||
| Gemini 3 Pro Image (Vorabversion) 🍌 | 2.000.000 | |||
| Einbettungsmodelle | ||||
| Gemini Embedding | 500.000 | |||
Stufe 2
| Modell | In die Warteschlange gestellte Batch-Tokens | |||
|---|---|---|---|---|
| Textausgabemodelle | ||||
| Gemini 3.1 Pro (Vorabversion) | 500.000.000 | |||
| Gemini 3.1 Flash-Lite (Vorabversion) | 500.000.000 | |||
| Gemini 3.1 Flash (Vorabversion) | 400.000.000 | |||
| Gemini 2.5 Pro | 500.000.000 | |||
| Gemini 2.5 Pro TTS | 100.000 | |||
| Gemini 2.5 Flash | 400.000.000 | |||
| Gemini 2.5 Flash (Vorabversion) | 400.000.000 | |||
| Gemini 2.5 Flash Image (Vorabversion) | 400.000.000 | |||
| Gemini 2.5 Flash TTS | 100.000 | |||
| Gemini 2.5 Flash-Lite | 500.000.000 | |||
| Gemini 2.5 Flash-Lite (Vorabversion) | 500.000.000 | |||
| Gemini 2.0 Flash | 1.000.000.000 | |||
| Gemini 2.0 Flash Image | 400.000.000 | |||
| Gemini 2.0 Flash-Lite | 1.000.000.000 | |||
| Multimodale Generierungsmodelle | ||||
| Gemini 3.1 Flash Image (Vorabversion) 🍌 | 250.000.000 | |||
| Gemini 3 Pro Image (Vorabversion) 🍌 | 270.000.000 | |||
| Einbettungsmodelle | ||||
| Gemini Embedding | 5.000.000 | |||
Stufe 3
| Modell | In die Warteschlange gestellte Batch-Tokens | |||
|---|---|---|---|---|
| Textausgabemodelle | ||||
| Gemini 3.1 Pro (Vorabversion) | 1.000.000.000 | |||
| Gemini 3.1 Flash-Lite (Vorabversion) | 1.000.000.000 | |||
| Gemini 3.1 Flash (Vorabversion) | 1.000.000.000 | |||
| Gemini 2.5 Pro | 1.000.000.000 | |||
| Gemini 2.5 Pro TTS | 1.000.000 | |||
| Gemini 2.5 Flash | 1.000.000.000 | |||
| Gemini 2.5 Flash (Vorabversion) | 1.000.000.000 | |||
| Gemini 2.5 Flash Image (Vorabversion) | 1.000.000.000 | |||
| Gemini 2.5 Flash TTS | 4.000.000 | |||
| Gemini 2.5 Flash-Lite | 1.000.000.000 | |||
| Gemini 2.5 Flash-Lite (Vorabversion) | 1.000.000.000 | |||
| Gemini 2.0 Flash | 5.000.000.000 | |||
| Gemini 2.0 Flash Image | 1.000.000.000 | |||
| Gemini 2.0 Flash-Lite | 5.000.000.000 | |||
| Multimodale Generierungsmodelle | ||||
| Gemini 3.1 Flash Image (Vorabversion) 🍌 | 750.000.000 | |||
| Gemini 3 Pro Image (Vorabversion) 🍌 | 1.000.000.000 | |||
| Einbettungsmodelle | ||||
| Gemini Embedding | 10.000.000 | |||
Auf die nächste Stufe upgraden
Wenn Sie von der kostenlosen Stufe zu einer kostenpflichtigen Stufe wechseln möchten, müssen Sie zuerst die Abrechnung in AI Studio einrichten.
Sobald Ihr Projekt die angegebenen Kriterien erfüllt, wird es automatisch auf die nächste Stufe hochgestuft. Upgrades von der kostenlosen Stufe auf Stufe 1 werden in der Regel sofort wirksam. Nachfolgende Upgrades werden innerhalb von 10 Minuten wirksam. Navigieren Sie zur Seite „Projekte“ in AI Studio, um Ihre Stufen zu prüfen.
Erhöhung der Ratenbegrenzung beantragen
Für jede Modellvariante gilt eine zugehörige Ratenbegrenzung (Anfragen pro Minute, RPM). Weitere Informationen zu diesen Ratenbegrenzungen finden Sie auf der Seite Ratenbegrenzung für AI Studio.
Erhöhung der Ratenbegrenzung für kostenpflichtige Stufen beantragen
Wir können nicht garantieren, dass Ihre Ratenbegrenzung erhöht wird, werden Ihre Anfrage aber bestmöglich prüfen.