Dieser Leitfaden bietet einen Überblick über die verschiedenen Abrechnungsoptionen für die Gemini API. wird erläutert, wie Sie die Abrechnung aktivieren und die Nutzung überwachen. FAQs zur Abrechnung
Abrechnung
Die Abrechnung für die Gemini API erfolgt in zwei Preisstufen: kostenlos (oder free) und Pay as you go (oder paid) aus. Preise und Ratenbegrenzungen unterscheiden sich und variieren je nach Modell. Für aktuelle Preise und Ratenbegrenzungen Weitere Informationen finden Sie unter Preise. Eine Aufschlüsselung der Funktionen für jedes Modell finden Sie in der Seite „Gemini-Modelle“
Ratenlimits
Ratenlimits sind Kontingente, die die Anzahl der Anfragen oder Tokens, die Sie in einem festgelegten Zeitfensters. Ratenbegrenzungen können pro Anfrage oder pro Token gelten. Hier ist ein fiktives Beispiel für Kontingente, die für ein bestimmtes Modell in einer bestimmten Stufe gelten könnten:
- 10 RPM (Anfragen pro Minute)
- 10.000 TPM (Tokens pro Minute)
- 1.000 RPD (Anfragen pro Tag)
Wenn Sie in diesem Beispiel 10 RPM (oder 10.000 TPM oder 1.000 RPD) überschreiten,
Der Gemini API-Dienst gibt einen 429: RESOURCE_EXHAUSTED
-Fehler aus
dass Sie die Ratenbegrenzung überschritten haben.
Vorteile der kostenpflichtigen Stufe
Wenn Sie die Abrechnung aktivieren und die kostenpflichtige Stufe verwenden, profitieren Sie von einem höheren Preis und deine Prompts und Antworten werden nicht zur Verbesserung von Google-Produkten verwendet. Weitere Informationen zur Datennutzung für kostenpflichtige Dienste finden Sie in den Nutzungsbedingungen.
Cloud Billing
Die Gemini API verwendet Cloud Billing für Abrechnungsdienste. Wenn Sie die kostenpflichtige Stufe verwenden möchten, müssen Sie Cloud Billing einrichten auf in Ihrem Cloud-Projekt. Nachdem Sie Cloud Billing aktiviert haben, können Sie Cloud Abrechnungstools für den Überblick über Ausgaben, Kosteninformationen, Zahlungen und Zugriff Cloud Billing-Support.
Abrechnung aktivieren
Sie können Cloud Billing in Google AI Studio aktivieren:
Öffnen Sie Google AI Studio.
Klicken Sie unten in der linken Seitenleiste auf Einstellungen > Informationen zum Tarif
Klicken Sie für das ausgewählte Projekt auf Abrechnung einrichten, um Cloud Billing zu aktivieren.
Nutzung überwachen
Nachdem Sie Cloud Billing aktiviert haben, können Sie Ihre Nutzung der Gemini API in
die
Google Cloud Console:
Der Dienstname der API lautet generativelanguage.googleapis.com
.
wird die Gemini API auch als Generative Language API bezeichnet.
Weitere Informationen finden Sie in der Google Cloud-Dokumentation zu API-Nutzung überwachen
Häufig gestellte Fragen
In diesem Abschnitt finden Sie Antworten auf häufig gestellte Fragen.
Was wird mir in Rechnung gestellt?
Die Preise für die Gemini API basieren auf Folgendem:
- Anzahl der Eingabetokens
- Anzahl der Ausgabetokens
- Anzahl der im Cache gespeicherten Tokens
- Speicherdauer von im Cache gespeicherten Tokens
Informationen zu den Preisen finden Sie in der Preisübersicht.
Wo kann ich mein Kontingent sehen?
Sie können Ihr Kontingent und Ihre Systemlimits in der Google Cloud Console:
Kann ich die Gemini API im EWR (einschließlich der EU), im Vereinigten Königreich und in der Schweiz kostenlos nutzen?
Über die API sind zwei Arten von Modellen verfügbar:
- Kostenpflichtige Modelle, darunter Gemini 1.5 Flash, Gemini 1.5 Pro und Gemini 1.0 Pro: Für diese Modelle gibt es im EWR keine kostenlose Stufe (einschließlich EU), das Vereinigte Königreich und die Schweiz. Entwickler müssen die erforderlichen Schritte um ein Rechnungskonto einzurichten und für die Nutzung zu bezahlen.
- Bestimmte Modelle sind in der Gemini API möglicherweise kostenlos verfügbar. (Siehe Unter ai.google.dev/pricing finden Sie Einzelheiten zu den Modellen, die wir in Rechnung stellen. die anderen Modelle kostenlos sind). Sie müssen jedoch noch eine Abrechnung einrichten, Konto verwenden, um diese Modelle zu verwenden.
Wenn ich die Abrechnung mit der Gemini API einrichte, wird mir dann die Nutzung von Google AI Studio in Rechnung gestellt?
Nein, die Nutzung von Google AI Studio ist weiterhin kostenlos, unabhängig davon, ob Sie Abrechnung in allen unterstützten Regionen, einschließlich EWR, EU, Vereinigtes Königreich und Schweiz.
Kann ich in der kostenlosen Stufe 1 Million Tokens verwenden?
Die kostenlose Stufe der Gemini API variiert je nach ausgewähltem Modell. Fürs Erste haben Sie können Sie das Kontextfenster von 1 Mio. Tokens auf folgende Arten ausprobieren:
- In Google AI Studio
- Mit „Pay as you go“-Tarifen
- Mit kostenlosen Tarifen für ausgewählte Modelle
Die aktuellen Ratenbegrenzungen für die einzelnen Modelle finden Sie auf der finden Sie hier.
Wie kann ich die Anzahl der Tokens berechnen, die ich verwende?
Verwenden Sie den GenerativeModel.count_tokens
.
, um die Anzahl der Tokens zu zählen. Weitere Informationen finden Sie im
Leitfaden zu Tokens
Wie wird die Abrechnung gehandhabt?
Die Abrechnung der Gemini API erfolgt über Cloud Billing-System.
Werden mir fehlgeschlagene Anfragen in Rechnung gestellt?
Schlägt Ihre Anfrage mit einem 400- oder 500-Fehler fehl, wird Ihnen der Tokens verwendet. Die Anfrage wird jedoch trotzdem auf Ihr Kontingent angerechnet.
Fallen für die Abstimmung der Modelle Gebühren an?
Die Modellabstimmung ist kostenlos, aber Ableitung zur Feinabstimmung wird der gleiche Preis wie die Basismodelle berechnet.
Werden GetTokens in Rechnung gestellt?
Anfragen an die GetTokens API werden nicht in Rechnung gestellt und auch nicht angerechnet, Inferenzkontingent.
Wo erhalte ich Hilfe bei der Abrechnung?
Hilfe bei der Abrechnung findest du unter Cloud Billing-Support