Limity liczby żądań regulują liczbę żądań, które możesz wysyłać do interfejsu Gemini API w określonym czasie. Te limity pomagają zachować uczciwe użytkowanie, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.
Wyświetlanie aktywnych limitów żądań w AI Studio
Jak działają limity szybkości
Limity szybkości są zwykle mierzone w 3 wymiarach:
- Żądania na minutę (RPM)
- Tokeny na minutę (dane wejściowe) (TPM)
- Żądania dziennie (RPD)
Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd limitu szybkości. Jeśli na przykład limit RPM wynosi 20, wykonanie 21 żądań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.
Limity liczby żądań są stosowane w przypadku poszczególnych projektów, a nie kluczy interfejsu API. Limity liczby żądań dziennie (RPD) są resetowane o północy czasu pacyficznego.
Limity różnią się w zależności od używanego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli, które mogą generować obrazy (Nano Banana), ale jest podobna do liczby tokenów na minutę. Inne modele mogą mieć limit tokenów na dzień (TPD).
W przypadku modeli eksperymentalnych i wersji podglądowych limity liczby żądań są bardziej restrykcyjne.
Limity oparte na wydatkach
Oprócz limitów liczby żądań na minutę (RPM) i tokenów na minutę (TPM) interfejs Gemini API wymusza limity oparte na wydatkach, aby chronić przed nieoczekiwanymi opłatami. To, czy te limity obowiązują na Twoim koncie, zależy od historii płatności i poziomu wykorzystania.
W tabeli poniżej przedstawiamy limity oparte na wydatkach dla każdego poziomu wykorzystania. Limity te są oceniane w 10-minutowym przedziale czasu. To, czy te limity obowiązują na Twoim koncie, zależy od historii płatności i stanu konta.
| Kategoria wykorzystania | Limit wydatków (na 10 minut) |
|---|---|
| Free | Nie dotyczy |
| Poziom 1 | 10 HKD |
| Poziom 2 | 200 HKD |
| Pracownik obsługi klienta poziomu 3 | 200 HKD |
Jeśli osiągniesz limit liczby żądań oparty na wydatkach, interfejs API zwróci 429 RESOURCE_EXHAUSTEDbłąd. Aby rozwiązać ten problem:
- Poczekaj i spróbuj ponownie po krótkim czasie.
- Zmniejsz liczbę kosztownych żądań, np. używając mniejszych okien kontekstowych lub krótszych wyników.
- Jeśli podczas normalnego użytkowania stale osiągasz ten limit, poproś o zwiększenie limitu.
Poziomy wykorzystania
Limity liczby żądań są powiązane z poziomem wykorzystania projektu. Wraz ze wzrostem wykorzystania interfejsu API i wydatków automatycznie przejdziesz na wyższy poziom z większymi limitami liczby żądań.
Kryteria kwalifikacji do poziomów 2 i 3 są oparte na łącznych wydatkach na usługi Google Cloud (w tym na Gemini API) na koncie rozliczeniowym połączonym z Twoim projektem.
| Kategoria wykorzystania | Kwalifikacje | Limit poziomu płatności |
|---|---|---|
| Free | Aktywny projekt lub bezpłatny okres próbny | Nie dotyczy |
| Poziom 1 | Skonfiguruj i połącz aktywne konto rozliczeniowe | 250 USD |
| Poziom 2 | Wypłata 100 USD + 3 dni od pierwszej udanej płatności | 2000 USD |
| Pracownik obsługi klienta poziomu 3 | Wypłata 1000 USD + 30 dni od pierwszej udanej płatności | 20 000–100 000 USD i więcej |
Spełnienie podanych kryteriów kwalifikacji jest zwykle wystarczające do zatwierdzenia, ale w rzadkich przypadkach prośba o przejście na wyższy poziom może zostać odrzucona z powodu innych czynników wykrytych podczas procesu weryfikacji.
Ten system pomaga zachować bezpieczeństwo i integralność platformy Gemini API dla wszystkich użytkowników.
Limity liczby żądań interfejsu Gemini API
Limity szybkości zależą od wielu czynników (np. od poziomu wykorzystania) i można je sprawdzić w Google AI Studio. W miarę jak Twój poziom i stan konta będą się zmieniać, limity żądań będą się automatycznie aktualizować.
Wyświetlanie aktywnych limitów żądań w AI Studio
Określone limity szybkości nie są gwarantowane, a rzeczywista przepustowość może się różnić.
Limity szybkości wnioskowania o priorytetach
Zużycie priorytetowe ma własne limity szybkości, mimo że jest wliczane do ogólnych limitów szybkości ruchu interaktywnego. Domyślne limity to: 0,3x standardowego limitu dla każdego modelu i poziomu
Limity częstotliwości żądań interfejsu Batch API
Żądania interfejsu Batch API podlegają własnym limitom szybkości, niezależnym od wywołań interfejsu API innych niż zbiorcze.
- Równoczesne żądania zbiorcze: 100
- Maksymalny rozmiar pliku wejściowego: 2 GB
- Limit miejsca na pliki: 20 GB
- Tokeny w kolejce według modelu: tabela Tokeny w kolejce w przypadku przetwarzania wsadowego zawiera maksymalną liczbę tokenów, które można umieścić w kolejce do przetwarzania wsadowego we wszystkich aktywnych zadaniach wsadowych dla danego modelu.
Poziom 1
| Model | Tokeny w kolejce w przypadku przetwarzania wsadowego | |||
|---|---|---|---|---|
| Modele generujące tekst | ||||
| Gemini 3.1 Pro (wersja testowa) | 5 000 000 | |||
| Gemini 3.1 Flash-Lite | 10 000 000 | |||
| Gemini 3.1 Flash-Lite (wersja testowa) | 10 000 000 | |||
| Gemini 3.5 Flash | 3 000 000 | |||
| Gemini 3.5 Flash | 3 000 000 | |||
| Gemini 2.5 Pro | 5 000 000 | |||
| Gemini 2.5 Pro TTS | 25 000 | |||
| Gemini 2.5 Flash | 3 000 000 | |||
| Gemini 2.5 Flash (wersja testowa) | 3 000 000 | |||
| Gemini 2.5 Flash Image (wersja testowa) | 3 000 000 | |||
| Gemini 2.5 Flash TTS | 100 000 | |||
| Gemini 2.5 Flash-Lite | 10 000 000 | |||
| Gemini 2.5 Flash-Lite (wersja testowa) | 10 000 000 | |||
| Gemini 2.0 Flash | 10 000 000 | |||
| Gemini 2.0 Flash Image | 3 000 000 | |||
| Gemini 2.0 Flash-Lite | 10 000 000 | |||
| Modele generowania multimodalnego | ||||
| Gemini 3.1 Flash Image (wersja testowa) 🍌 | 1 000 000 | |||
| Gemini 3 Pro Image (wersja testowa) 🍌 | 2 000 000 | |||
| Modele wektorów dystrybucyjnych | ||||
| Osadzanie Gemini | 500 000 | |||
Poziom 2
| Model | Tokeny w kolejce w przypadku przetwarzania wsadowego | |||
|---|---|---|---|---|
| Modele generujące tekst | ||||
| Gemini 3.1 Pro (wersja testowa) | 500 000 000 | |||
| Gemini 3.1 Flash-Lite | 500 000 000 | |||
| Gemini 3.1 Flash-Lite (wersja testowa) | 500 000 000 | |||
| Gemini 3.5 Flash | 400 000 000 | |||
| Gemini 3.5 Flash | 400 000 000 | |||
| Gemini 2.5 Pro | 500 000 000 | |||
| Gemini 2.5 Pro TTS | 100 000 | |||
| Gemini 2.5 Flash | 400 000 000 | |||
| Gemini 2.5 Flash (wersja testowa) | 400 000 000 | |||
| Gemini 2.5 Flash Image (wersja testowa) | 400 000 000 | |||
| Gemini 2.5 Flash TTS | 100 000 | |||
| Gemini 2.5 Flash-Lite | 500 000 000 | |||
| Gemini 2.5 Flash-Lite (wersja testowa) | 500 000 000 | |||
| Gemini 2.0 Flash | 1 000 000 000 | |||
| Gemini 2.0 Flash Image | 400 000 000 | |||
| Gemini 2.0 Flash-Lite | 1 000 000 000 | |||
| Modele generowania multimodalnego | ||||
| Gemini 3.1 Flash Image (wersja testowa) 🍌 | 250 000 000 | |||
| Gemini 3 Pro Image (wersja testowa) 🍌 | 270 000 000 | |||
| Modele wektorów dystrybucyjnych | ||||
| Osadzanie Gemini | 5 000 000 | |||
Poziom 3
| Model | Tokeny w kolejce w przypadku przetwarzania wsadowego | |||
|---|---|---|---|---|
| Modele generujące tekst | ||||
| Gemini 3.1 Pro (wersja testowa) | 1 000 000 000 | |||
| Gemini 3.1 Flash-Lite | 1 000 000 000 | |||
| Gemini 3.1 Flash-Lite (wersja testowa) | 1 000 000 000 | |||
| Gemini 3.5 Flash | 1 000 000 000 | |||
| Gemini 3.5 Flash | 1 000 000 000 | |||
| Gemini 2.5 Pro | 1 000 000 000 | |||
| Gemini 2.5 Pro TTS | 1 000 000 | |||
| Gemini 2.5 Flash | 1 000 000 000 | |||
| Gemini 2.5 Flash (wersja testowa) | 1 000 000 000 | |||
| Gemini 2.5 Flash Image (wersja testowa) | 1 000 000 000 | |||
| Gemini 2.5 Flash TTS | 4 000 000 | |||
| Gemini 2.5 Flash-Lite | 1 000 000 000 | |||
| Gemini 2.5 Flash-Lite (wersja testowa) | 1 000 000 000 | |||
| Gemini 2.0 Flash | 5 000 000 000 | |||
| Gemini 2.0 Flash Image | 1 000 000 000 | |||
| Gemini 2.0 Flash-Lite | 5 000 000 000 | |||
| Modele generowania multimodalnego | ||||
| Gemini 3.1 Flash Image (wersja testowa) 🍌 | 750 000 000 | |||
| Gemini 3 Pro Image (wersja testowa) 🍌 | 1 000 000 000 | |||
| Modele wektorów dystrybucyjnych | ||||
| Osadzanie Gemini | 10 000 000 | |||
Jak przejść na wyższy poziom
Aby przejść z poziomu bezpłatnego na płatny, musisz najpierw skonfigurować płatności w AI Studio.
Gdy Twój projekt spełni określone kryteria, zostanie automatycznie uaktualniony do wyższego poziomu. Przejście z abonamentu Free na abonament Tier 1 zwykle następuje natychmiast, a kolejne przejścia na wyższe abonamenty zaczynają obowiązywać w ciągu 10 minut. Otwórz stronę Projekty w AI Studio, aby sprawdzić swoje poziomy.
Prośba o zwiększenie limitu liczby żądań
Każda odmiana modelu ma powiązany limit szybkości (żądania na minutę, RPM). Szczegółowe informacje o tych limitach znajdziesz na stronie Limity szybkości w AI Studio.
Prośba o zwiększenie limitu częstotliwości w przypadku konta płatnego
Nie możemy zagwarantować zwiększenia limitu żądań, ale dołożymy wszelkich starań, aby rozpatrzyć Twoją prośbę.