W tym przewodniku znajdziesz omówienie różnych opcji płatności w interfejsie Gemini API, informacje o włączaniu płatności i monitorowaniu wykorzystania oraz odpowiedzi na najczęstsze pytania dotyczące płatności.
Informacje o płatnościach
Płatności za Gemini API są naliczane na podstawie 2 poziomów cen: bezpłatny (lub bezpłatny) i według wykorzystania (lub płatny). Limity cen i stawek różnią się na poszczególnych poziomach, a także w zależności od modelu. Aktualne ceny i limity szybkości znajdziesz w sekcji Ceny. Szczegółowe informacje o możliwościach poszczególnych modeli znajdziesz na stronie modeli Gemini.
Ograniczenia liczby żądań
Ograniczenia liczby żądań to limity, które regulują liczbę żądań, które możesz wysyłać do interfejsu Gemini API w danym przedziale czasu. Te limity pomagają zapewnić uczciwe korzystanie z usługi, chronią przed nadużywaniem oraz utrzymują optymalną wydajność dla wszystkich użytkowników.
Limity szybkości mają kilka podstawowych funkcji:
- Zapobieganie nadużyciom: chronią interfejs API przed działaniami osób, które próbują zakłócić lub przeciążyć system.
- Zapewnienie uczciwego dostępu: limity szybkości zapobiegają monopolizowaniu zasobów interfejsu API przez pojedynczego użytkownika, zapewniając wszystkim użytkownikom płynne działanie.
- Zarządzanie obciążeniem infrastruktury: dzięki ograniczaniu liczby żądań limity szybkości pomagają zachować stałą wydajność interfejsu API i zapobiegają przeciążeniu serwera.
Oto przykład fikcyjnych limitów, które mogą obowiązywać w przypadku danego modelu na danym poziomie:
- 10 RPM (żądań na minutę)
- 10 tys. TPM (tokenów na minutę)
- 1000 RPD (żądań dziennie)
W tym przykładzie, jeśli przekroczysz 10 RPM (lub 10 000 TPM lub 1000 RPD), usługa Gemini API zwróci błąd 429: RESOURCE_EXHAUSTED
,wskazujący, że przekroczono limit szybkości.
Jak działają limity szybkości
Ograniczenia liczby żądań są mierzone w 4 wymiarach:
- Żądania na minutę (RPM)
- Liczba żądań dziennie (RPD)
- Tokeny na minutę (TPM)
- Obrazy na minutę (IPM)
Twoje wykorzystanie jest oceniane na podstawie każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd limitu szybkości. Jeśli np. Twój limit RPM wynosi 20, wysłanie 21 żądań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.
Limity szybkości są stosowane na poziomie projektu, a nie klucza interfejsu API.
Limity różnią się w zależności od konkretnego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład IPM jest obliczany tylko w przypadku modeli zdolnych do generowania obrazów.
Zwiększenie poziomów wykorzystania i limitów szybkości
Limity szybkości są powiązane z poziomem wykorzystania projektu. Wraz ze wzrostem wykorzystania interfejsu API i wydatków możesz przejść na wyższy poziom z większymi limitami szybkości.
Poziom | Kwalifikacje |
---|---|
Wersja bezpłatna | Użytkownicy w kwalifikujących się krajach |
Poziom 1 | Konto rozliczeniowe zostało połączone |
Poziom 2 | Łączne wydatki: 250 USD; łączne wymagane wydatki mają co najmniej 30 dni |
Gdy żądasz uaktualnienia, nasz automatyczny system ochrony przed nadużyciami przeprowadza dodatkowe kontrole. Spełnienie kryteriów kwalifikacji zwykle wystarcza do zatwierdzenia, ale w rzadkich przypadkach prośba o przeniesienie może zostać odrzucona ze względu na inne czynniki zidentyfikowane podczas procesu weryfikacji.
System ten pomaga zapewnić bezpieczeństwo i integralność platformy Gemini API dla wszystkich użytkowników.
Jak poprosić o uaktualnienie
Interfejs Gemini API korzysta z Cloud Billing do obsługi wszystkich usług płatności. Aby przejść z poziomu bezpłatnego na płatny, musisz najpierw włączyć Płatności w Google Cloud w projekcie Google Cloud.
Gdy projekt spełnia określone kryteria, może zostać przeniesiony na wyższy poziom. Aby poprosić o przekształcenie konta, wykonaj te czynności:
- Otwórz stronę kluczy interfejsu API AI Studio.
- Odszukaj projekt, który chcesz ulepszyć, i kliknij Ulepsz.
- System automatycznie zweryfikuje, czy Twój projekt kwalifikuje się do udziału w programie. Ten proces zajmie kilka sekund.
- Jeśli Twój projekt spełnia wszystkie wymagania, zostanie natychmiast przeniesiony do następnego poziomu.
Dlaczego warto korzystać z płatnego poziomu?
Gdy włączysz rozliczenia i użyjesz płatnego poziomu, możesz korzystać z wyższych limitów stawek, a Twoje prompty i odpowiedzi nie będą wykorzystywane do ulepszania usług Google. Więcej informacji o używaniu danych w płatnych usługach znajdziesz w Warunkach korzystania z usługi.
Rozliczenia usługi Google Cloud
Interfejs Gemini API korzysta z usługi Rozliczenia do obsługi płatności. Aby korzystać z poziomu płatnego, musisz skonfigurować rozliczenia Cloud w swoim projekcie w chmurze. Po włączeniu Rozliczeń usługi Google Cloud możesz używać narzędzi Rozliczeń usługi Google Cloud do śledzenia wydatków, analizowania kosztów, dokonywania płatności i uzyskiwania pomocy od zespołu pomocy ds. Rozliczeń usługi Google Cloud.
Włącz płatności
Rozliczenia usługi Google Cloud możesz włączyć z poziomu Google AI Studio:
Otwórz Google AI Studio.
U dołu paska bocznego po lewej stronie kliknij Ustawienia > Informacje o planie.
Aby włączyć Rozliczenia Cloud, kliknij Skonfiguruj rozliczenia w wybranym projekcie.
Monitorowanie wykorzystania
Po włączeniu płatności w chmurze możesz monitorować wykorzystanie interfejsu Gemini API w konsoli Google Cloud.
Nazwa usługi dla interfejsu API to generativelanguage.googleapis.com
, a w konsoli interfejs Gemini API jest też nazywany interfejsem Generative Language API.
Więcej informacji znajdziesz w dokumentacji Google Cloud poświęconej monitorowaniu wykorzystania interfejsu API.
Najczęstsze pytania
Ta sekcja zawiera odpowiedzi na najczęstsze pytania.
Za co płacę?
Ceny Gemini API są ustalane na podstawie:
- Liczba tokenów wejściowych
- Liczba tokenów wyjściowych
- Liczba tokenów w pamięci podręcznej
- Czas przechowywania tokenów w pamięci podręcznej
Informacje o cenach znajdziesz na tej stronie.
Gdzie mogę sprawdzić swoją kwotę?
Limity i limity systemowe możesz wyświetlić w konsoli Google Cloud.
Jak poprosić o zwiększenie limitu?
Aby poprosić o zwiększenie limitu, wykonaj instrukcje podane w artykule Jak poprosić o przeniesienie na wyższy poziom.
Czy mogę korzystać z Gemini API bezpłatnie w Europejskim Obszarze Gospodarczym (w tym w UE), Wielkiej Brytanii i Szwajcarii?
Tak, bezpłatne i płatne wersje są dostępne w wielu regionach.
Czy jeśli skonfiguruję płatności za pomocą Gemini API, będę płacić za korzystanie z Google AI Studio?
Nie. Korzystanie z Google AI Studio pozostaje bezpłatne niezależnie od tego, czy skonfigurujesz rozliczenia we wszystkich obsługiwanych regionach.
Czy mogę używać 1 mln tokenów na poziomie bezpłatnym?
Bezpłatny poziom Gemini API różni się w zależności od wybranego modelu. Obecnie możesz wypróbować okno kontekstu z milionem tokenów w jeden z tych sposobów:
- W Google AI Studio
- Abonamenty płatne według wykorzystania
- z bezpłatnymi planami w przypadku wybranych modeli.
Najnowsze limity bezpłatnych stawek w poszczególnych modelach znajdziesz na stronie z cennikiem.
Jak obliczyć liczbę tokenów, których używam?
Aby zliczać tokeny, użyj metody GenerativeModel.count_tokens
. Więcej informacji o tokenach znajdziesz w przewodniku na ich temat.
Czy mogę korzystać z moich środków w Google Cloud w ramach interfejsu Gemini API?
Tak. Środki Google Cloud można wykorzystać na korzystanie z interfejsu Gemini API.
Jak wyglądają płatności?
Rozliczenia za Gemini API są obsługiwane przez system Rozliczenia usługi Google Cloud.
Czy pobierana jest opłata za nieudane żądania?
Jeśli żądanie zakończy się niepowodzeniem z błędem 400 lub 500, nie zostaniesz obciążony opłatą za użyte tokeny. Prośba będzie jednak wliczana do limitu.
Czy dostrajanie modeli jest płatne?
Dostrojenie modelu jest bezpłatne, ale wnioskowanie na podstawie dostrojonych modeli jest opłacane według tej samej stawki co modele podstawowe.
Czy GetTokens jest usługą płatną?
Żądania do interfejsu GetTokens API nie są naliczane i nie są wliczane do limitu wnioskowania.
Jak są przetwarzane moje dane w Google AI Studio, jeśli mam płatne konto API?
Szczegółowe informacje o sposobie przetwarzania danych, gdy włączone są Rozliczenia usługi Google Cloud, znajdziesz w warunkach (patrz „Jak Google wykorzystuje Twoje dane” w sekcji „Usługi płatne”). Pamiętaj, że prompty Google AI Studio są traktowane zgodnie z tymi samymi warunkami „Usług płatnych”, o ile w przynajmniej 1 projekcie interfejsu API masz włączone rozliczenia. Możesz to sprawdzić na stronie klucza Gemini API, jeśli w sekcji „Plan” widzisz projekty oznaczone jako „Płatne”.
Gdzie mogę uzyskać pomoc dotyczącą płatności?
Aby uzyskać pomoc dotyczącą płatności, zapoznaj się z artykułem Uzyskiwanie pomocy dotyczącej Rozliczeń usługi Google Cloud.