Mit Ratenlimits wird die Anzahl der Anfragen geregelt, die Sie innerhalb eines bestimmten Zeitraums an die Gemini API senden können. Diese Limits tragen dazu bei, eine faire Nutzung zu ermöglichen, vor Missbrauch zu schützen und die Systemleistung für alle Nutzer aufrechtzuerhalten.
Funktionsweise von Ratelimits
Die Ratenbegrenzungen werden in drei Dimensionen gemessen:
- Anfragen pro Minute (RPM)
- Anfragen pro Tag (RPD)
- Tokens pro Minute (TPM)
Ihre Nutzung wird anhand der einzelnen Limits bewertet. Wenn eines davon überschritten wird, wird ein Fehler für die Ratenbegrenzung ausgelöst. Wenn Ihr RPM-Limit beispielsweise 20 beträgt, führt das Senden von 21 Anfragen innerhalb einer Minute zu einem Fehler, auch wenn Sie Ihr TPM oder andere Limits nicht überschritten haben.
Ratenbegrenzungen gelten pro Projekt, nicht pro API-Schlüssel.
Die Limits variieren je nach verwendetem Modell und einige gelten nur für bestimmte Modelle. „Bilder pro Minute“ (IPM) wird beispielsweise nur für Modelle berechnet, die Bilder generieren können (Bild 3), ist aber konzeptionell mit TPM vergleichbar.
Nutzungsstufen
Die Ratenbegrenzungen sind an die Nutzungsstufe des Projekts gebunden, die wir bald einführen werden. Wenn Ihre API-Nutzung und Ihre Ausgaben steigen, können Sie zu einer höheren Stufe mit höheren Ratenlimits wechseln.
Stufe | Qualifikationen |
---|---|
Kostenlos | Nutzer in teilnehmenden Ländern |
Preisstufe 1 | Rechnungskonto, das mit dem Projekt verknüpft ist |
Preisstufe 2 | Gesamtausgaben: 250 $ + mindestens 30 Tage nach erfolgreicher Zahlung |
Ebene 3 | Noch nicht verfügbar, wird demnächst eingeführt. |
Wenn Sie ein Upgrade beantragen, führt unser automatisiertes System zum Schutz vor Missbrauch zusätzliche Prüfungen durch. Die Erfüllung der angegebenen Qualifikationskriterien ist in der Regel ausreichend für die Genehmigung. In seltenen Fällen kann ein Upgradeantrag aufgrund anderer Faktoren, die bei der Überprüfung festgestellt wurden, abgelehnt werden.
Dieses System trägt dazu bei, die Sicherheit und Integrität der Gemini API-Plattform für alle Nutzer zu gewährleisten.
Aktuelle Preislimits
Kostenlose Stufe
Modell | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 15 | 1.000.000 | 1.500 |
Gemini 2.0 Flash Experimental | 10 | 1.000.000 | 1.500 |
Gemini 2.0 Flash-Lite | 30 | 1.000.000 | 1.500 |
Gemini 2.0 Pro Experimental 02-05 | 2 | 1.000.000 | 50 |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4.000.000 | 1.500 |
Gemini 1.5 Flash | 15 | 1.000.000 | 1.500 |
Gemini 1.5 Flash-8B | 15 | 1.000.000 | 1.500 |
Gemini 1.5 Pro, | 2 | 32.000 | 50 |
Imagen 3 | -- | -- | -- |
Gemma 3 | 30 | 15.000 | 14.400 |
Gemini Embedding Experimental 03-07 | 5 | -- | 100 |
Preisstufe 1
Modell | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 2.000 | 4.000.000 | -- |
Gemini 2.0 Flash Experimental | 10 | 4.000.000 | -- |
Gemini 2.0 Flash-Lite | 4.000 | 4.000.000 | -- |
Gemini 2.0 Pro Experimental 02-05 | 5 | 1.000.000 | -- |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4.000.000 | -- |
Gemini 1.5 Flash | 2.000 | 4.000.000 | -- |
Gemini 1.5 Flash-8B | 4.000 | 4.000.000 | -- |
Gemini 1.5 Pro, | 1.000 | 4.000.000 | -- |
Imagen 3 | -- | 20 Bilder pro Minute (IPM) | -- |
Gemma 3 | -- | -- | -- |
Gemini Embedding Experimental 03-07 | 10 | -- | 1.000 |
Preisstufe 2
Modell | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 10.000 | 10.000.000 | -- |
Gemini 2.0 Flash-Lite | 4.000 | 4.000.000 | -- |
Gemini 2.0 Pro Experimental 02-05 | 5 | 1.000.000 | -- |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4.000.000 | -- |
Gemini 1.5 Flash | 2.000 | 4.000.000 | -- |
Gemini 1.5 Flash-8B | 4.000 | 4.000.000 | -- |
Gemini 1.5 Pro, | 1.000 | 4.000.000 | -- |
Imagen 3 | -- | 20 Bilder pro Minute (IPM) | -- |
Gemini Embedding Experimental 03-07 | 10 | -- | 1.000 |
Die angegebenen Ratenlimits sind nicht garantiert und die tatsächliche Kapazität kann variieren.
So führen Sie ein Upgrade auf die nächste Stufe durch
Die Gemini API verwendet Cloud Billing für alle Abrechnungsdienste. Wenn Sie von der kostenlosen Stufe zu einem kostenpflichtigen Tarif wechseln möchten, müssen Sie zuerst die Cloud-Abrechnung für Ihr Google Cloud-Projekt aktivieren.
Sobald Ihr Projekt die angegebenen Kriterien erfüllt, kann es auf die nächste Stufe umgestellt werden. So beantragen Sie ein Upgrade:
- Rufen Sie in AI Studio die Seite API-Schlüssel auf.
- Suchen Sie das Projekt, das Sie aktualisieren möchten, und klicken Sie auf „Upgrade“. Die Option „Upgrade“ wird nur für Projekte angezeigt, die die Voraussetzungen für die nächste Stufe erfüllen.
Nach einer kurzen Überprüfung wird das Projekt auf die nächste Stufe umgestellt.
Erhöhung des Ratenlimits beantragen
Jede Modellvariante hat ein Ratelimit (Anfragen pro Minute, RPM). Weitere Informationen zu diesen Grenzwerten finden Sie unter Gemini-Modelle.
Erhöhung der Ratenbeschränkung für kostenpflichtige Stufen beantragen
Wir können nicht garantieren, dass wir Ihre Ratenbeschränkung erhöhen. Wir werden Ihre Anfrage jedoch prüfen und uns mit Ihnen in Verbindung setzen, wenn wir Ihre Kapazitätsanforderungen erfüllen können.