Ograniczenia liczby żądań

Limity liczby żądań regulują liczbę żądań, które możesz wysyłać do interfejsu Gemini API w określonym czasie. Te limity pomagają zachować uczciwe korzystanie z usługi, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.

Wyświetlanie aktywnych limitów żądań w AI Studio

Jak działają limity szybkości

Limity szybkości są zwykle mierzone w 3 wymiarach:

  • Żądania na minutę (RPM)
  • Tokeny na minutę (dane wejściowe) (TPM)
  • Żądania dziennie (RPD)

Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd limitu szybkości. Jeśli na przykład limit zapytań na minutę wynosi 20, wykonanie 21 zapytań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu zapytań na minutę ani innych limitów.

Limity liczby żądań są stosowane do poszczególnych projektów, a nie do kluczy interfejsu API. Limity liczby żądań dziennie (RPD) są resetowane o północy czasu pacyficznego.

Limity różnią się w zależności od używanego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli, które mogą generować obrazy (Imagen 3), ale jest podobna do liczby tokenów na minutę (TPM). Inne modele mogą mieć limit tokenów na dzień (TPD).

W przypadku modeli eksperymentalnych i wersji zapoznawczych limity są bardziej restrykcyjne.

Poziomy wykorzystania

Limity liczby żądań są powiązane z poziomem wykorzystania projektu. Wraz ze wzrostem wykorzystania interfejsu API i wydatków będziesz mieć możliwość przejścia na wyższy poziom z większymi limitami liczby żądań.

Kryteria kwalifikacji do poziomów 2 i 3 są oparte na łącznych wydatkach na usługi Google Cloud (w tym na Gemini API) na koncie rozliczeniowym połączonym z Twoim projektem.

Poziom Kwalifikacje
Bezpłatnie Użytkownicy w kwalifikujących się krajach
Poziom 1 W pełni opłacone konto rozliczeniowe połączone z projektem
Poziom 2 Łączne wydatki: > 250 USD i co najmniej 30 dni od pomyślnej płatności
Poziom 3 Łączne wydatki: > 1000 PLN i co najmniej 30 dni od pomyślnej płatności

Gdy poprosisz o przejście na wyższą wersję, nasz automatyczny system ochrony przed nadużyciami przeprowadzi dodatkowe kontrole. Spełnienie podanych kryteriów kwalifikacji zwykle wystarcza do zatwierdzenia, ale w rzadkich przypadkach prośba o przejście na wyższy poziom może zostać odrzucona z powodu innych czynników wykrytych podczas procesu weryfikacji.

Ten system pomaga zachować bezpieczeństwo i integralność platformy Gemini API dla wszystkich użytkowników.

Limity liczby żądań interfejsu Gemini API

Limity szybkości zależą od różnych czynników (np. od poziomu limitu) i można je sprawdzić w Google AI Studio. W miarę jak Twój poziom i stan konta będą się zmieniać, limity żądań będą automatycznie aktualizowane.

Wyświetlanie aktywnych limitów żądań w AI Studio

Określone limity szybkości nie są gwarantowane, a rzeczywista przepustowość może się różnić.

Limity częstotliwości żądań interfejsu Batch API

Żądania interfejsu Batch API podlegają własnym limitom liczby żądań, które są niezależne od wywołań interfejsu API niebędących żądaniami zbiorczymi.

  • Równoczesne żądania zbiorcze: 100
  • Limit rozmiaru pliku wejściowego: 2 GB
  • Limit miejsca na pliki: 20 GB
  • Tokeny w kolejce według modelu: tabela Tokeny w kolejce w przypadku przetwarzania wsadowego zawiera maksymalną liczbę tokenów, które można umieścić w kolejce do przetwarzania wsadowego we wszystkich aktywnych zadaniach wsadowych dla danego modelu.

Poziom 1

Model Tokeny w kolejce do przetwarzania zbiorczego
Modele tekstowe
Wersja testowa Gemini 3 Pro 5 000 000
Wersja testowa Gemini 3 Flash 3 000 000
Gemini 2.5 Pro 5 000 000
Gemini 2.5 Pro TTS 25 000
Gemini 2.5 Flash 3 000 000
Wersja testowa Gemini 2.5 Flash 3 000 000
Podgląd obrazu Gemini 2.5 Flash 3 000 000
Gemini 2.5 Flash TTS 100 000
Gemini 2.5 Flash-Lite 10 000 000
Wersja testowa Gemini 2.5 Flash-Lite 10 000 000
Gemini 2.0 Flash 10 000 000
Gemini 2.0 Flash Image 3 000 000
Gemini 2.0 Flash-Lite 10 000 000
Modele generowania multimodalnego
Gemini 3 Pro Image Preview 🍌 2 000 000

Poziom 2

Model Tokeny w kolejce do przetwarzania zbiorczego
Modele tekstowe
Wersja testowa Gemini 3 Pro 500 000 000
Wersja testowa Gemini 3 Flash 400 000 000
Gemini 2.5 Pro 500 000 000
Gemini 2.5 Pro TTS 100 000
Gemini 2.5 Flash 400 000 000
Wersja testowa Gemini 2.5 Flash 400 000 000
Podgląd obrazu Gemini 2.5 Flash 400 000 000
Gemini 2.5 Flash TTS 100 000
Gemini 2.5 Flash-Lite 500 000 000
Wersja testowa Gemini 2.5 Flash-Lite 500 000 000
Gemini 2.0 Flash 1 000 000 000
Gemini 2.0 Flash Image 400 000 000
Gemini 2.0 Flash-Lite 1 000 000 000
Modele generowania multimodalnego
Gemini 3 Pro Image Preview 🍌 270 000 000

Poziom 3

Model Tokeny w kolejce do przetwarzania zbiorczego
Modele tekstowe
Wersja testowa Gemini 3 Pro 1 000 000 000
Wersja testowa Gemini 3 Flash 1 000 000 000
Gemini 2.5 Pro 1 000 000 000
Gemini 2.5 Pro TTS 1 000 000
Gemini 2.5 Flash 1 000 000 000
Wersja testowa Gemini 2.5 Flash 1 000 000 000
Podgląd obrazu Gemini 2.5 Flash 1 000 000 000
Gemini 2.5 Flash TTS 4 000 000
Gemini 2.5 Flash-Lite 1 000 000 000
Wersja testowa Gemini 2.5 Flash-Lite 1 000 000 000
Gemini 2.0 Flash 5 000 000 000
Gemini 2.0 Flash Image 1 000 000 000
Gemini 2.0 Flash-Lite 5 000 000 000
Modele generowania multimodalnego
Gemini 3 Pro Image Preview 🍌 1 000 000 000

Jak przejść na wyższy poziom

Interfejs Gemini API korzysta z Cloud Billing w przypadku wszystkich usług rozliczeniowych. Aby przejść z poziomu bezpłatnego na płatny, musisz najpierw włączyć płatności Cloud w swoim projekcie Google Cloud.

Gdy Twój projekt spełni określone kryteria, będzie kwalifikować się do przejścia na wyższy poziom. Aby poprosić o przekształcenie:

Po szybkiej weryfikacji projekt zostanie uaktualniony do następnego poziomu.

Wysyłanie prośby o zwiększenie limitu częstotliwości

Każda odmiana modelu ma powiązany limit szybkości (żądania na minutę, RPM). Szczegółowe informacje o tych limitach znajdziesz w sekcji Modele Gemini.

Prośba o zwiększenie limitu częstotliwości w przypadku wersji płatnej

Nie możemy zagwarantować zwiększenia limitu, ale dołożymy wszelkich starań, aby rozpatrzyć Twoją prośbę.