Ratenlimits

Mit Ratenlimits wird die Anzahl der Anfragen geregelt, die Sie innerhalb eines bestimmten Zeitraums an die Gemini API senden können. Diese Limits tragen dazu bei, eine faire Nutzung zu ermöglichen, vor Missbrauch zu schützen und die Systemleistung für alle Nutzer aufrechtzuerhalten.

Funktionsweise von Ratelimits

Die Ratenbegrenzungen werden in drei Dimensionen gemessen:

  • Anfragen pro Minute (RPM)
  • Anfragen pro Tag (RPD)
  • Tokens pro Minute (TPM)

Ihre Nutzung wird anhand der einzelnen Limits bewertet. Wenn eines davon überschritten wird, wird ein Fehler für die Ratenbegrenzung ausgelöst. Wenn Ihr RPM-Limit beispielsweise 20 beträgt, führt das Senden von 21 Anfragen innerhalb einer Minute zu einem Fehler, auch wenn Sie Ihr TPM oder andere Limits nicht überschritten haben.

Ratenbegrenzungen gelten pro Projekt, nicht pro API-Schlüssel.

Die Limits variieren je nach verwendetem Modell und einige gelten nur für bestimmte Modelle. „Bilder pro Minute“ (IPM) wird beispielsweise nur für Modelle berechnet, die Bilder generieren können (Bild 3), ist aber konzeptionell mit TPM vergleichbar.

Nutzungsstufen

Die Ratenbegrenzungen sind an die Nutzungsstufe des Projekts gebunden, die wir bald einführen werden. Wenn Ihre API-Nutzung und Ihre Ausgaben steigen, können Sie zu einer höheren Stufe mit höheren Ratenlimits wechseln.

Stufe Qualifikationen
Kostenlos Nutzer in unterstützten Ländern
Preisstufe 1 Rechnungskonto, das mit dem Projekt verknüpft ist
Preisstufe 2 Gesamtausgaben: 250 $ + mindestens 30 Tage nach erfolgreicher Zahlung
Ebene 3 Gesamtausgaben: 1.000 $ und mindestens 30 Tage nach erfolgreicher Zahlung

Wenn Sie ein Upgrade beantragen, führt unser automatisiertes System zum Schutz vor Missbrauch zusätzliche Prüfungen durch. Die Erfüllung der angegebenen Qualifikationskriterien ist in der Regel ausreichend für die Genehmigung. In seltenen Fällen kann ein Upgradeantrag aufgrund anderer Faktoren, die im Überprüfungsprozess festgestellt wurden, abgelehnt werden.

Dieses System trägt dazu bei, die Sicherheit und Integrität der Gemini API-Plattform für alle Nutzer zu gewährleisten.

Aktuelle Preislimits

Modell RPM TPM RPD
Gemini 2.5 Pro Experimental 5 1.000.000 25
Gemini 2.5 Pro (Vorabversion) -- -- --
Gemini 2.0 Flash 15 1.000.000 1.500
Gemini 2.0 Flash Experimental (einschließlich Bildgenerierung) 10 1.000.000 1.500
Gemini 2.0 Flash-Lite 30 1.000.000 1.500
Gemini 2.0 Flash Thinking Experimental 01-21 10 4.000.000 1.500
Gemini 1.5 Flash 15 1.000.000 1.500
Gemini 1.5 Flash-8B 15 1.000.000 1.500
Gemini 1.5 Pro, 2 32.000 50
Veo 2 -- -- --
Imagen 3 -- -- --
Gemma 3 30 15.000 14.400
Gemini Embedding Experimental 03-07 5 -- 100
Modell RPM TPM RPD
Gemini 2.5 Pro Experimental -- -- --
Gemini 2.5 Pro (Vorabversion) 150 2.000.000 1.000
Gemini 2.0 Flash 2.000 4.000.000 --
Gemini 2.0 Flash Experimental (einschließlich Bildgenerierung) 10 4.000.000 --
Gemini 2.0 Flash-Lite 4.000 4.000.000 --
Gemini 2.0 Flash Thinking Experimental 01-21 10 4.000.000 --
Gemini 1.5 Flash 2.000 4.000.000 --
Gemini 1.5 Flash-8B 4.000 4.000.000 --
Gemini 1.5 Pro, 1.000 4.000.000 --
Imagen 3 -- 20 Bilder pro Minute (IPM) --
Veo 2 2 -- 50
Gemma 3 30 15.000 14.400
Gemini Embedding Experimental 03-07 10 -- 1.000
Modell RPM TPM RPD
Gemini 2.5 Pro Experimental -- -- --
Gemini 2.5 Pro (Vorabversion) 1.000 5.000.000 50.000
Gemini 2.0 Flash 10.000 10.000.000 --
Gemini 2.0 Flash Experimental (einschließlich Bildgenerierung) 10 4.000.000 --
Gemini 2.0 Flash-Lite 4.000 4.000.000 --
Gemini 2.0 Flash Thinking Experimental 01-21 10 4.000.000 --
Gemini 1.5 Flash 2.000 4.000.000 --
Gemini 1.5 Flash-8B 4.000 4.000.000 --
Gemini 1.5 Pro, 1.000 4.000.000 --
Imagen 3 -- 20 Bilder pro Minute (IPM) --
Veo 2 -- -- --
Gemma 3 30 15.000 14.400
Gemini Embedding Experimental 03-07 10 -- 1.000
--
Modell RPM TPM RPD
Gemini 2.5 Pro (Vorabversion) 2.000 8.000.000 --
Gemini 2.0 Flash 30.000 30.000.000 --
Gemini 2.0 Flash-Lite 4.000 4.000.000

Die angegebenen Ratenlimits sind nicht garantiert und die tatsächliche Kapazität kann variieren.

Live API-Ratenlimits

Anzahl gleichzeitiger Sitzungen TPM
3 1.000.000
Anzahl gleichzeitiger Sitzungen TPM
50 4.000.000
Anzahl gleichzeitiger Sitzungen TPM
1000 10.000.000
Anzahl gleichzeitiger Sitzungen TPM
Noch nicht verfügbar Noch nicht verfügbar

Die angegebenen Ratenlimits sind nicht garantiert und die tatsächliche Kapazität kann variieren.

So führen Sie ein Upgrade auf die nächste Stufe durch

Die Gemini API verwendet Cloud Billing für alle Abrechnungsdienste. Wenn Sie von der kostenlosen Stufe zu einem kostenpflichtigen Tarif wechseln möchten, müssen Sie zuerst die Cloud-Abrechnung für Ihr Google Cloud-Projekt aktivieren.

Sobald Ihr Projekt die angegebenen Kriterien erfüllt, kann es auf die nächste Stufe umgestellt werden. So beantragen Sie ein Upgrade:

Nach einer kurzen Überprüfung wird das Projekt auf die nächste Stufe umgestellt.

Erhöhung der Ratenbeschränkung beantragen

Jede Modellvariante hat ein Ratelimit (Anfragen pro Minute, RPM). Weitere Informationen zu diesen Grenzwerten finden Sie unter Gemini-Modelle.

Erhöhung der Ratenbeschränkung für kostenpflichtige Stufen beantragen

Wir können nicht garantieren, dass wir Ihre Ratenbeschränkung erhöhen. Wir werden Ihren Antrag jedoch prüfen und uns mit Ihnen in Verbindung setzen, wenn wir Ihre Kapazitätsanforderungen erfüllen können.