Ograniczenia liczby żądań

Limity liczby żądań regulują liczbę żądań, które możesz wysyłać do interfejsu Gemini API w określonym czasie. Te limity pomagają zachować uczciwe korzystanie z usługi, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.

Wyświetlanie aktywnych limitów żądań w AI Studio

Jak działają limity szybkości

Limity szybkości są zwykle mierzone w 3 wymiarach:

  • Żądania na minutę (RPM)
  • Tokeny na minutę (dane wejściowe) (TPM)
  • Żądania dziennie (RPD)

Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd limitu szybkości. Jeśli na przykład limit zapytań na minutę wynosi 20, wykonanie 21 zapytań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu zapytań na minutę ani innych limitów.

Limity liczby żądań są stosowane w przypadku poszczególnych projektów, a nie kluczy interfejsu API. Limity liczby żądań dziennie (RPD) są resetowane o północy czasu pacyficznego.

Limity różnią się w zależności od używanego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli, które mogą generować obrazy (Imagen 3), ale jest koncepcyjnie podobna do liczby tokenów na minutę (TPM). Inne modele mogą mieć limit tokenów na dzień (TPD).

W przypadku modeli eksperymentalnych i wersji zapoznawczych limity są bardziej restrykcyjne.

Kategorie wykorzystania

Limity liczby żądań są powiązane z poziomem wykorzystania projektu. Wraz ze wzrostem wykorzystania interfejsu API i wydatków będziesz mieć możliwość przejścia na wyższy poziom z większymi limitami liczby żądań.

Kryteria kwalifikacji do poziomów 2 i 3 są oparte na łącznych wydatkach na usługi Google Cloud (w tym na Gemini API) na koncie rozliczeniowym połączonym z Twoim projektem.

Poziom Kwalifikacje
Bezpłatnie Użytkownicy w kwalifikujących się krajach
Poziom 1 W pełni opłacone konto rozliczeniowe połączone z projektem
Poziom 2 Łączne wydatki: > 250 USD i co najmniej 30 dni od pomyślnej płatności
Poziom 3 Łączne wydatki: > 1000 PLN i co najmniej 30 dni od pomyślnej płatności

Gdy poprosisz o przejście na wyższą wersję, nasz automatyczny system ochrony przed nadużyciami przeprowadzi dodatkowe kontrole. Spełnienie podanych kryteriów kwalifikacji jest zwykle wystarczające do zatwierdzenia, ale w rzadkich przypadkach prośba o przejście na wyższy poziom może zostać odrzucona z powodu innych czynników wykrytych podczas procesu weryfikacji.

Ten system pomaga zachować bezpieczeństwo i integralność platformy interfejsu Gemini API dla wszystkich użytkowników.

Limity liczby żądań interfejsu Gemini API

Limity szybkości zależą od różnych czynników (np. od poziomu limitu) i można je sprawdzić w Google AI Studio. W miarę jak Twój poziom i stan konta będą się zmieniać, limity żądań będą automatycznie aktualizowane.

Wyświetlanie aktywnych limitów żądań w AI Studio

Określone limity szybkości nie są gwarantowane, a rzeczywista przepustowość może się różnić.

Limity częstotliwości żądań interfejsu Batch API

Żądania interfejsu Batch API podlegają własnym limitom liczby żądań, które są niezależne od wywołań interfejsu API niebędących żądaniami zbiorczymi.

  • Równoczesne żądania zbiorcze: 100
  • Limit rozmiaru pliku wejściowego: 2 GB
  • Limit miejsca na pliki: 20 GB
  • Tokeny w kolejce według modelu: kolumna Tokeny w kolejce w przypadku przetwarzania wsadowego w tabeli limitów szybkości zawiera maksymalną liczbę tokenów, które można umieścić w kolejce do przetwarzania wsadowego we wszystkich aktywnych zadaniach wsadowych dla danego modelu. Znajdziesz je w tabeli standardowych limitów liczby żądań do interfejsu API.

Poziom 1

Model Tokeny w kolejce w przypadku przetwarzania zbiorczego
Modele tekstowe
Wersja testowa Gemini 3 Pro 50 000 000
Gemini 2.5 Pro 5 000 000
Gemini 2.5 Flash 3 000 000
Wersja testowa Gemini 2.5 Flash 3 000 000
Gemini 2.5 Flash-Lite 10 000 000
Wersja testowa Gemini 2.5 Flash-Lite 10 000 000
Gemini 2.0 Flash 10 000 000
Gemini 2.0 Flash-Lite 10 000 000
Modele generowania multimodalnego
Gemini 3 Pro Image Preview 🍌 2 000 000

Poziom 2

Model Tokeny w kolejce w przypadku przetwarzania zbiorczego
Modele tekstowe
Wersja testowa Gemini 3 Pro 500 000 000
Gemini 2.5 Pro 500 000 000
Gemini 2.5 Flash 400 000 000
Wersja testowa Gemini 2.5 Flash 400 000 000
Gemini 2.5 Flash-Lite 500 000 000
Wersja testowa Gemini 2.5 Flash-Lite 500 000 000
Gemini 2.0 Flash 1 000 000 000
Gemini 2.0 Flash-Lite 1 000 000 000
Modele generowania multimodalnego
Gemini 3 Pro Image Preview 🍌 270 000 000

Poziom 3

Tokeny w kolejce w przypadku przetwarzania zbiorczego
Modele tekstowe
Wersja testowa Gemini 3 Pro 1 000 000 000
Gemini 2.5 Pro 1 000 000 000
Gemini 2.5 Flash 1 000 000 000
Wersja testowa Gemini 2.5 Flash 1 000 000 000
Gemini 2.5 Flash-Lite 1 000 000 000
Wersja testowa Gemini 2.5 Flash-Lite 1 000 000 000
Gemini 2.0 Flash 5 000 000 000
Gemini 2.0 Flash-Lite 5 000 000 000
Modele generowania multimodalnego
Gemini 3 Pro Image Preview 🍌 5000 5 000 000 * 1 000 000 000

Jak przejść na wyższy poziom

Interfejs Gemini API korzysta z Cloud Billing w przypadku wszystkich usług rozliczeniowych. Aby przejść z poziomu bezpłatnego na płatny, musisz najpierw włączyć płatności Cloud w swoim projekcie Google Cloud.

Gdy Twój projekt spełni określone kryteria, będzie kwalifikować się do przejścia na wyższy poziom. Aby poprosić o przekształcenie:

Po szybkiej weryfikacji projekt zostanie uaktualniony do następnego poziomu.

Wysyłanie prośby o zwiększenie limitu częstotliwości

Każda odmiana modelu ma powiązany limit szybkości (żądania na minutę, RPM). Szczegółowe informacje o tych limitach znajdziesz w sekcji Modele Gemini.

Prośba o zwiększenie limitu częstotliwości w przypadku wersji płatnej

Nie możemy zagwarantować zwiększenia limitu, ale dołożymy wszelkich starań, aby rozpatrzyć Twoją prośbę.