Ratenlimits

Mit Ratenlimits wird die Anzahl der Anfragen geregelt, die Sie innerhalb eines bestimmten Zeitraums an die Gemini API senden können. Diese Limits tragen dazu bei, die Fairness der Nutzung zu wahren, vor Missbrauch zu schützen und die Systemleistung für alle Nutzer aufrechtzuerhalten.

So funktionieren die Limits für die Rate

Die Ratenbegrenzung wird in der Regel in drei Dimensionen gemessen:

  • Anfragen pro Minute (RPM)
  • Anfragen pro Tag (RPD)
  • Tokens pro Minute (Input) (TPM)

Ihre Nutzung wird anhand der einzelnen Limits bewertet. Wenn eines davon überschritten wird, wird ein Fehler für die Ratenbeschränkung ausgelöst. Wenn Ihr RPM-Limit beispielsweise 20 beträgt, führt das Senden von 21 Anfragen innerhalb einer Minute zu einem Fehler, auch wenn Sie Ihr TPM oder andere Limits nicht überschritten haben.

Ratenbegrenzungen gelten pro Projekt, nicht pro API-Schlüssel.

Die Limits variieren je nach verwendetem Modell und einige gelten nur für bestimmte Modelle. „Bilder pro Minute“ (IPM) wird beispielsweise nur für Modelle berechnet, die Bilder generieren können (Bild 3). Konzeptionell ähnelt es dem TPM. Andere Modelle haben möglicherweise ein Tageslimit für Tokens.

Für experimentelle und Vorabversionen gelten strengere Ratenlimits.

Nutzungsstufen

Die Ratenbegrenzungen sind an die Nutzungsstufe des Projekts gebunden. Wenn Ihre API-Nutzung und -Ausgaben steigen, können Sie zu einer höheren Stufe mit höheren Ratenlimits wechseln.

Stufe Qualifikationen
Kostenlos Nutzer in unterstützten Ländern
Preisstufe 1 Rechnungskonto, das mit dem Projekt verknüpft ist
Preisstufe 2 Gesamtausgaben: > 250 $ und mindestens 30 Tage nach erfolgreicher Zahlung
Ebene 3 Gesamtausgaben: > 1.000 $ und mindestens 30 Tage seit der letzten erfolgreichen Zahlung

Wenn Sie ein Upgrade beantragen, führt unser automatisiertes System zum Schutz vor Missbrauch zusätzliche Prüfungen durch. Die Erfüllung der angegebenen Qualifikationskriterien ist in der Regel ausreichend für die Genehmigung. In seltenen Fällen kann ein Upgradeantrag aufgrund anderer Faktoren, die im Überprüfungsprozess festgestellt wurden, abgelehnt werden.

Dieses System trägt dazu bei, die Sicherheit und Integrität der Gemini API-Plattform für alle Nutzer aufrechtzuerhalten.

Aktuelle Preislimits

Kostenlose Stufe

Modell RPM TPM RPD
Gemini 2.5 Pro -- -- --
Gemini 2.5 Flash 10 250.000 250
Gemini 2.5 Flash-Lite Preview 06-17 15 250.000 1.000
Gemini 2.5 Flash Preview TTS 3 10.000 15
Gemini 2.5 Pro-Vorabversion – Sprachausgabe -- -- --
Gemini 2.0 Flash 15 1.000.000 200
Gemini 2.0 Flash-Vorabversion – Bildgenerierung 10 200.000 100
Gemini 2.0 Flash-Lite 30 1.000.000 200
Imagen 3 -- -- --
Veo 2 -- -- --
Gemini 1.5 Flash (veraltet) 15 250.000 50
Gemini 1.5 Flash-8B (veraltet) 15 250.000 50
Gemini 1.5 Pro (veraltet) -- -- --
Gemma 3 und 3n 30 15.000 14.400
Gemini Embedding Experimental 03-07 5 -- 100

Preisstufe 1

Modell RPM TPM RPD
Gemini 2.5 Pro 150 2.000.000 1.000
Gemini 2.5 Flash 1.000 1.000.000 10.000
Gemini 2.5 Flash-Lite Preview 06-17 4.000 4.000.000 --
Gemini 2.5 Flash Preview TTS 10 10.000 100
Gemini 2.5 Pro-Vorabversion – Sprachausgabe 10 10.000 50
Gemini 2.0 Flash 2.000 4.000.000 --
Gemini 2.0 Flash-Vorabversion – Bildgenerierung 1.000 1.000.000 10.000
Gemini 2.0 Flash-Lite 4.000 4.000.000 --
Imagen 3 -- 20 Bilder pro Minute (IPM) --
Veo 2 2 Videos pro Minute (VPM) -- 50 Videos pro Tag (VPD)
Gemini 1.5 Flash (veraltet) 2.000 4.000.000 --
Gemini 1.5 Flash-8B (veraltet) 4.000 4.000.000 --
Gemini 1.5 Pro (veraltet) 1.000 4.000.000 --
Gemma 3 und 3n 30 15.000 14.400
Gemini Embedding Experimental 03-07 10 -- 1.000

Preisstufe 2

Modell RPM TPM RPD
Gemini 2.5 Pro 1.000 5.000.000 50.000
Gemini 2.5 Flash 2.000 3.000.000 100.000
Gemini 2.5 Flash-Lite Preview 06-17 10.000 10.000.000 100.000
Gemini 2.5 Flash Preview TTS 1.000 100.000 10.000
Gemini 2.5 Pro-Vorabversion – Sprachausgabe 100 25.000 1.000
Gemini 2.0 Flash 10.000 10.000.000 --
Gemini 2.0 Flash-Vorabversion – Bildgenerierung 2.000 3.000.000 100.000
Gemini 2.0 Flash-Lite 20.000 10.000.000 --
Imagen 3 -- 20 Bilder pro Minute (IPM) --
Veo 2 2 Videos pro Minute (VPM) -- 50 Videos pro Tag (VPD)
Gemini 1.5 Flash (veraltet) 2.000 4.000.000 --
Gemini 1.5 Flash-8B (veraltet) 4.000 4.000.000 --
Gemini 1.5 Pro (veraltet) 1.000 4.000.000 --
Gemma 3 und 3n 30 15.000 14.400
Gemini Embedding Experimental 03-07 10 -- 1.000

Ebene 3

Modell RPM TPM RPD
Gemini 2.5 Pro 2.000 8.000.000 --
Gemini 2.5 Flash 10.000 8.000.000 --
Gemini 2.5 Flash-Lite Preview 06-17 30.000 30.000.000 --
Gemini 2.5 Flash Preview TTS 1.000 1.000.000 --
Gemini 2.5 Pro-Vorabversion – Sprachausgabe 100 1.000.000 --
Gemini 2.0 Flash 30.000 30.000.000 --
Gemini 2.0 Flash-Vorabversion – Bildgenerierung 5.000 5.000.000 --
Gemini 2.0 Flash-Lite 30.000 30.000.000 --
Imagen 3 -- 20 Bilder pro Minute (IPM) --
Veo 2 2 Videos pro Minute (VPM) -- 50 Videos pro Tag (VPD)
Gemini 1.5 Flash (veraltet) 2.000 4.000.000 --
Gemini 1.5 Flash-8B (veraltet) 4.000 4.000.000 --
Gemini 1.5 Pro (veraltet) 1.000 4.000.000 --
Gemma 3 und 3n 30 15.000 14.400
Gemini Embedding Experimental 03-07 10 -- 1.000

Die angegebenen Ratenlimits sind nicht garantiert und die tatsächliche Kapazität kann variieren.

Live API-Ratenlimits

Kostenlose Stufe

Name Gleichzeitig geöffnete Sitzungen TPM RPD
Gemini 2.5 Flash Live 3 1.000.000 --
Gemini 2.0 Flash Live 3 1.000.000 --
Gemini 2.5 Flash-Vorabversion – Dialogfeld für native Audioinhalte 1 25.000 5
Gemini 2.5 Flash – experimenteller Dialog für natives Audio-Thinking 1 10.000 5

Preisstufe 1

Name Gleichzeitig geöffnete Sitzungen TPM RPD
Gemini 2.5 Flash Live 50 4.000.000 --
Gemini 2.0 Flash Live 50 4.000.000 --
Gemini 2.5 Flash-Vorabversion – Dialogfeld für native Audioinhalte 3 50.000 50
Gemini 2.5 Flash – experimenteller Dialog für natives Audio-Thinking 1 25.000 50

Preisstufe 2

Name Gleichzeitig geöffnete Sitzungen TPM RPD
Gemini 2.5 Flash Live 1000 10.000.000 --
Gemini 2.0 Flash Live 1000 10.000.000 --
Gemini 2.5 Flash-Vorabversion – Dialogfeld für native Audioinhalte 100 1.000.000 Unbegrenzt
Gemini 2.5 Flash – experimenteller Dialog für natives Audio-Thinking -- -- --

Ebene 3

Name Gleichzeitig geöffnete Sitzungen TPM RPD
Gemini 2.5 Flash Live 1000 10.000.000 --
Gemini 2.0 Flash Live 1000 10.000.000 --
Gemini 2.5 Flash-Vorabversion – Dialogfeld für native Audioinhalte -- -- --
Gemini 2.5 Flash – experimenteller Dialog für natives Audio-Thinking -- -- --

Die angegebenen Ratenlimits sind nicht garantiert und die tatsächliche Kapazität kann variieren.

So führen Sie ein Upgrade auf die nächste Stufe durch

Die Gemini API verwendet Cloud Billing für alle Abrechnungsdienste. Wenn Sie von der kostenlosen Stufe zu einem kostenpflichtigen Tarif wechseln möchten, müssen Sie zuerst die Cloud-Abrechnung für Ihr Google Cloud-Projekt aktivieren.

Sobald Ihr Projekt die angegebenen Kriterien erfüllt, kann es auf die nächste Stufe umgestellt werden. So beantragen Sie ein Upgrade:

Nach einer kurzen Überprüfung wird das Projekt auf die nächste Stufe umgestellt.

Erhöhung der Ratenbeschränkung beantragen

Jede Modellvariante hat ein Ratelimit (Anfragen pro Minute, RPM). Weitere Informationen zu diesen Grenzwerten finden Sie unter Gemini-Modelle.

Erhöhung der Ratenbegrenzung für kostenpflichtige Stufen beantragen

Wir können nicht garantieren, dass wir Ihre Ratenbeschränkung erhöhen. Wir werden Ihren Antrag jedoch prüfen und uns mit Ihnen in Verbindung setzen, wenn wir Ihre Kapazitätsanforderungen erfüllen können.