Limity liczby żądań regulują liczbę żądań, które możesz wysyłać do interfejsu Gemini API w określonym czasie. Te limity pomagają zachować uczciwe korzystanie z usługi, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.
Wyświetlanie aktywnych limitów żądań w AI Studio
Jak działają limity szybkości
Limity szybkości są zwykle mierzone w 3 wymiarach:
- Żądania na minutę (RPM)
- Tokeny na minutę (dane wejściowe) (TPM)
- Żądania dziennie (RPD)
Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd limitu szybkości. Jeśli na przykład limit zapytań na minutę wynosi 20, wykonanie 21 zapytań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu zapytań na minutę ani innych limitów.
Limity liczby żądań są stosowane w przypadku poszczególnych projektów, a nie kluczy interfejsu API. Limity liczby żądań dziennie (RPD) są resetowane o północy czasu pacyficznego.
Limity różnią się w zależności od używanego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli, które mogą generować obrazy (Imagen 3), ale jest koncepcyjnie podobna do liczby tokenów na minutę (TPM). Inne modele mogą mieć limit tokenów na dzień (TPD).
W przypadku modeli eksperymentalnych i wersji zapoznawczych limity są bardziej restrykcyjne.
Kategorie wykorzystania
Limity liczby żądań są powiązane z poziomem wykorzystania projektu. Wraz ze wzrostem wykorzystania interfejsu API i wydatków będziesz mieć możliwość przejścia na wyższy poziom z większymi limitami liczby żądań.
Kryteria kwalifikacji do poziomów 2 i 3 są oparte na łącznych wydatkach na usługi Google Cloud (w tym na Gemini API) na koncie rozliczeniowym połączonym z Twoim projektem.
| Poziom | Kwalifikacje |
|---|---|
| Bezpłatnie | Użytkownicy w kwalifikujących się krajach |
| Poziom 1 | W pełni opłacone konto rozliczeniowe połączone z projektem |
| Poziom 2 | Łączne wydatki: > 250 USD i co najmniej 30 dni od pomyślnej płatności |
| Poziom 3 | Łączne wydatki: > 1000 PLN i co najmniej 30 dni od pomyślnej płatności |
Gdy poprosisz o przejście na wyższą wersję, nasz automatyczny system ochrony przed nadużyciami przeprowadzi dodatkowe kontrole. Spełnienie podanych kryteriów kwalifikacji jest zwykle wystarczające do zatwierdzenia, ale w rzadkich przypadkach prośba o przejście na wyższy poziom może zostać odrzucona z powodu innych czynników wykrytych podczas procesu weryfikacji.
Ten system pomaga zachować bezpieczeństwo i integralność platformy interfejsu Gemini API dla wszystkich użytkowników.
Limity liczby żądań interfejsu Gemini API
Limity szybkości zależą od różnych czynników (np. od poziomu limitu) i można je sprawdzić w Google AI Studio. W miarę jak Twój poziom i stan konta będą się zmieniać, limity żądań będą automatycznie aktualizowane.
Wyświetlanie aktywnych limitów żądań w AI Studio
Określone limity szybkości nie są gwarantowane, a rzeczywista przepustowość może się różnić.
Limity częstotliwości żądań interfejsu Batch API
Żądania interfejsu Batch API podlegają własnym limitom liczby żądań, które są niezależne od wywołań interfejsu API niebędących żądaniami zbiorczymi.
- Równoczesne żądania zbiorcze: 100
- Limit rozmiaru pliku wejściowego: 2 GB
- Limit miejsca na pliki: 20 GB
- Tokeny w kolejce według modelu: kolumna Tokeny w kolejce w przypadku przetwarzania wsadowego w tabeli limitów szybkości zawiera maksymalną liczbę tokenów, które można umieścić w kolejce do przetwarzania wsadowego we wszystkich aktywnych zadaniach wsadowych dla danego modelu. Znajdziesz je w tabeli standardowych limitów liczby żądań do interfejsu API.
Poziom 1
| Model | Tokeny w kolejce w przypadku przetwarzania zbiorczego | |||
|---|---|---|---|---|
| Modele tekstowe | ||||
| Wersja testowa Gemini 3 Pro | 50 000 000 | |||
| Gemini 2.5 Pro | 5 000 000 | |||
| Gemini 2.5 Flash | 3 000 000 | |||
| Wersja testowa Gemini 2.5 Flash | 3 000 000 | |||
| Gemini 2.5 Flash-Lite | 10 000 000 | |||
| Wersja testowa Gemini 2.5 Flash-Lite | 10 000 000 | |||
| Gemini 2.0 Flash | 10 000 000 | |||
| Gemini 2.0 Flash-Lite | 10 000 000 | |||
| Modele generowania multimodalnego | ||||
| Gemini 3 Pro Image Preview 🍌 | 2 000 000 | |||
Poziom 2
| Model | Tokeny w kolejce w przypadku przetwarzania zbiorczego | |||
|---|---|---|---|---|
| Modele tekstowe | ||||
| Wersja testowa Gemini 3 Pro | 500 000 000 | |||
| Gemini 2.5 Pro | 500 000 000 | |||
| Gemini 2.5 Flash | 400 000 000 | |||
| Wersja testowa Gemini 2.5 Flash | 400 000 000 | |||
| Gemini 2.5 Flash-Lite | 500 000 000 | |||
| Wersja testowa Gemini 2.5 Flash-Lite | 500 000 000 | |||
| Gemini 2.0 Flash | 1 000 000 000 | |||
| Gemini 2.0 Flash-Lite | 1 000 000 000 | |||
| Modele generowania multimodalnego | ||||
| Gemini 3 Pro Image Preview 🍌 | 270 000 000 | |||
Poziom 3
| Tokeny w kolejce w przypadku przetwarzania zbiorczego | ||||
|---|---|---|---|---|
| Modele tekstowe | ||||
| Wersja testowa Gemini 3 Pro | 1 000 000 000 | |||
| Gemini 2.5 Pro | 1 000 000 000 | |||
| Gemini 2.5 Flash | 1 000 000 000 | |||
| Wersja testowa Gemini 2.5 Flash | 1 000 000 000 | |||
| Gemini 2.5 Flash-Lite | 1 000 000 000 | |||
| Wersja testowa Gemini 2.5 Flash-Lite | 1 000 000 000 | |||
| Gemini 2.0 Flash | 5 000 000 000 | |||
| Gemini 2.0 Flash-Lite | 5 000 000 000 | |||
| Modele generowania multimodalnego | ||||
| Gemini 3 Pro Image Preview 🍌 | 5000 | 5 000 000 | * | 1 000 000 000 |
Jak przejść na wyższy poziom
Interfejs Gemini API korzysta z Cloud Billing w przypadku wszystkich usług rozliczeniowych. Aby przejść z poziomu bezpłatnego na płatny, musisz najpierw włączyć płatności Cloud w swoim projekcie Google Cloud.
Gdy Twój projekt spełni określone kryteria, będzie kwalifikować się do przejścia na wyższy poziom. Aby poprosić o przekształcenie:
- Otwórz stronę kluczy interfejsów API w AI Studio.
- Znajdź projekt, który chcesz uaktualnić, i kliknij „Uaktualnij”. Opcja „Uaktualnij” będzie widoczna tylko w przypadku projektów, które spełniają wymagania dotyczące kolejnego poziomu.
Po szybkiej weryfikacji projekt zostanie uaktualniony do następnego poziomu.
Wysyłanie prośby o zwiększenie limitu częstotliwości
Każda odmiana modelu ma powiązany limit szybkości (żądania na minutę, RPM). Szczegółowe informacje o tych limitach znajdziesz w sekcji Modele Gemini.
Prośba o zwiększenie limitu częstotliwości w przypadku wersji płatnej
Nie możemy zagwarantować zwiększenia limitu, ale dołożymy wszelkich starań, aby rozpatrzyć Twoją prośbę.