Ograniczenia liczby żądań

Limity liczby żądań regulują liczbę żądań, które możesz wysyłać do interfejsu Gemini API w określonym czasie. Te limity pomagają zachować uczciwe użytkowanie, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.

Wyświetlanie aktywnych limitów żądań w AI Studio

Jak działają limity szybkości

Limity szybkości są zwykle mierzone w 3 wymiarach:

  • Żądania na minutę (RPM)
  • Tokeny na minutę (dane wejściowe) (TPM)
  • Żądania dziennie (RPD)

Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd limitu szybkości. Jeśli na przykład limit RPM wynosi 20, wykonanie 21 żądań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.

Limity liczby żądań są stosowane w przypadku poszczególnych projektów, a nie kluczy interfejsu API. Limity liczby żądań dziennie (RPD) są resetowane o północy czasu pacyficznego.

Limity różnią się w zależności od używanego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli, które mogą generować obrazy (Nano Banana), ale jest podobna do liczby tokenów na minutę. Inne modele mogą mieć limit tokenów na dzień (TPD).

W przypadku modeli eksperymentalnych i wersji podglądowych limity liczby żądań są bardziej restrykcyjne.

Limity oparte na wydatkach

Oprócz limitów liczby żądań na minutę (RPM) i tokenów na minutę (TPM) interfejs Gemini API wymusza limity oparte na wydatkach, aby chronić przed nieoczekiwanymi opłatami. To, czy te limity obowiązują na Twoim koncie, zależy od historii płatności i poziomu wykorzystania.

W tabeli poniżej przedstawiamy limity oparte na wydatkach dla każdego poziomu wykorzystania. Limity te są oceniane w 10-minutowym przedziale czasu. To, czy te limity obowiązują na Twoim koncie, zależy od historii płatności i stanu konta.

Kategoria wykorzystania Limit wydatków (na 10 minut)
Free Nie dotyczy
Poziom 1 10 HKD
Poziom 2 200 HKD
Pracownik obsługi klienta poziomu 3 200 HKD

Jeśli osiągniesz limit liczby żądań oparty na wydatkach, interfejs API zwróci 429 RESOURCE_EXHAUSTEDbłąd. Aby rozwiązać ten problem:

  • Poczekaj i spróbuj ponownie po krótkim czasie.
  • Zmniejsz liczbę kosztownych żądań, np. używając mniejszych okien kontekstowych lub krótszych wyników.
  • Jeśli podczas normalnego użytkowania stale osiągasz ten limit, poproś o zwiększenie limitu.

Poziomy wykorzystania

Limity liczby żądań są powiązane z poziomem wykorzystania projektu. Wraz ze wzrostem wykorzystania interfejsu API i wydatków automatycznie przejdziesz na wyższy poziom z większymi limitami liczby żądań.

Kryteria kwalifikacji do poziomów 2 i 3 są oparte na łącznych wydatkach na usługi Google Cloud (w tym na Gemini API) na koncie rozliczeniowym połączonym z Twoim projektem.

Kategoria wykorzystania Kwalifikacje Limit poziomu płatności
Free Aktywny projekt lub bezpłatny okres próbny Nie dotyczy
Poziom 1 Skonfiguruj i połącz aktywne konto rozliczeniowe 250 USD
Poziom 2 Wypłata 100 USD + 3 dni od pierwszej udanej płatności 2000 USD
Pracownik obsługi klienta poziomu 3 Wypłata 1000 USD + 30 dni od pierwszej udanej płatności 20 000–100 000 USD i więcej

Spełnienie podanych kryteriów kwalifikacji jest zwykle wystarczające do zatwierdzenia, ale w rzadkich przypadkach prośba o przejście na wyższy poziom może zostać odrzucona z powodu innych czynników wykrytych podczas procesu weryfikacji.

Ten system pomaga zachować bezpieczeństwo i integralność platformy Gemini API dla wszystkich użytkowników.

Limity liczby żądań interfejsu Gemini API

Limity szybkości zależą od wielu czynników (np. od poziomu wykorzystania) i można je sprawdzić w Google AI Studio. W miarę jak Twój poziom i stan konta będą się zmieniać, limity żądań będą się automatycznie aktualizować.

Wyświetlanie aktywnych limitów żądań w AI Studio

Określone limity szybkości nie są gwarantowane, a rzeczywista przepustowość może się różnić.

Limity szybkości wnioskowania o priorytetach

Zużycie priorytetowe ma własne limity szybkości, mimo że jest wliczane do ogólnych limitów szybkości ruchu interaktywnego. Domyślne limity to: 0,3x standardowego limitu dla każdego modelu i poziomu

Limity częstotliwości żądań interfejsu Batch API

Żądania interfejsu Batch API podlegają własnym limitom szybkości, niezależnym od wywołań interfejsu API innych niż zbiorcze.

  • Równoczesne żądania zbiorcze: 100
  • Maksymalny rozmiar pliku wejściowego: 2 GB
  • Limit miejsca na pliki: 20 GB
  • Tokeny w kolejce według modelu: tabela Tokeny w kolejce w przypadku przetwarzania wsadowego zawiera maksymalną liczbę tokenów, które można umieścić w kolejce do przetwarzania wsadowego we wszystkich aktywnych zadaniach wsadowych dla danego modelu.

Poziom 1

Model Tokeny w kolejce w przypadku przetwarzania wsadowego
Modele generujące tekst
Gemini 3.1 Pro (wersja testowa) 5 000 000
Gemini 3.1 Flash-Lite 10 000 000
Gemini 3.1 Flash-Lite (wersja testowa) 10 000 000
Gemini 3.5 Flash 3 000 000
Gemini 3.5 Flash 3 000 000
Gemini 2.5 Pro 5 000 000
Gemini 2.5 Pro TTS 25 000
Gemini 2.5 Flash 3 000 000
Gemini 2.5 Flash (wersja testowa) 3 000 000
Gemini 2.5 Flash Image (wersja testowa) 3 000 000
Gemini 2.5 Flash TTS 100 000
Gemini 2.5 Flash-Lite 10 000 000
Gemini 2.5 Flash-Lite (wersja testowa) 10 000 000
Gemini 2.0 Flash 10 000 000
Gemini 2.0 Flash Image 3 000 000
Gemini 2.0 Flash-Lite 10 000 000
Modele generowania multimodalnego
Gemini 3.1 Flash Image (wersja testowa) 🍌 1 000 000
Gemini 3 Pro Image (wersja testowa) 🍌 2 000 000
Modele wektorów dystrybucyjnych
Osadzanie Gemini 500 000

Poziom 2

Model Tokeny w kolejce w przypadku przetwarzania wsadowego
Modele generujące tekst
Gemini 3.1 Pro (wersja testowa) 500 000 000
Gemini 3.1 Flash-Lite 500 000 000
Gemini 3.1 Flash-Lite (wersja testowa) 500 000 000
Gemini 3.5 Flash 400 000 000
Gemini 3.5 Flash 400 000 000
Gemini 2.5 Pro 500 000 000
Gemini 2.5 Pro TTS 100 000
Gemini 2.5 Flash 400 000 000
Gemini 2.5 Flash (wersja testowa) 400 000 000
Gemini 2.5 Flash Image (wersja testowa) 400 000 000
Gemini 2.5 Flash TTS 100 000
Gemini 2.5 Flash-Lite 500 000 000
Gemini 2.5 Flash-Lite (wersja testowa) 500 000 000
Gemini 2.0 Flash 1 000 000 000
Gemini 2.0 Flash Image 400 000 000
Gemini 2.0 Flash-Lite 1 000 000 000
Modele generowania multimodalnego
Gemini 3.1 Flash Image (wersja testowa) 🍌 250 000 000
Gemini 3 Pro Image (wersja testowa) 🍌 270 000 000
Modele wektorów dystrybucyjnych
Osadzanie Gemini 5 000 000

Poziom 3

Model Tokeny w kolejce w przypadku przetwarzania wsadowego
Modele generujące tekst
Gemini 3.1 Pro (wersja testowa) 1 000 000 000
Gemini 3.1 Flash-Lite 1 000 000 000
Gemini 3.1 Flash-Lite (wersja testowa) 1 000 000 000
Gemini 3.5 Flash 1 000 000 000
Gemini 3.5 Flash 1 000 000 000
Gemini 2.5 Pro 1 000 000 000
Gemini 2.5 Pro TTS 1 000 000
Gemini 2.5 Flash 1 000 000 000
Gemini 2.5 Flash (wersja testowa) 1 000 000 000
Gemini 2.5 Flash Image (wersja testowa) 1 000 000 000
Gemini 2.5 Flash TTS 4 000 000
Gemini 2.5 Flash-Lite 1 000 000 000
Gemini 2.5 Flash-Lite (wersja testowa) 1 000 000 000
Gemini 2.0 Flash 5 000 000 000
Gemini 2.0 Flash Image 1 000 000 000
Gemini 2.0 Flash-Lite 5 000 000 000
Modele generowania multimodalnego
Gemini 3.1 Flash Image (wersja testowa) 🍌 750 000 000
Gemini 3 Pro Image (wersja testowa) 🍌 1 000 000 000
Modele wektorów dystrybucyjnych
Osadzanie Gemini 10 000 000

Jak przejść na wyższy poziom

Aby przejść z poziomu bezpłatnego na płatny, musisz najpierw skonfigurować płatności w AI Studio.

Gdy Twój projekt spełni określone kryteria, zostanie automatycznie uaktualniony do wyższego poziomu. Przejście z abonamentu Free na abonament Tier 1 zwykle następuje natychmiast, a kolejne przejścia na wyższe abonamenty zaczynają obowiązywać w ciągu 10 minut. Otwórz stronę Projekty w AI Studio, aby sprawdzić swoje poziomy.

Prośba o zwiększenie limitu liczby żądań

Każda odmiana modelu ma powiązany limit szybkości (żądania na minutę, RPM). Szczegółowe informacje o tych limitach znajdziesz na stronie Limity szybkości w AI Studio.

Prośba o zwiększenie limitu częstotliwości w przypadku konta płatnego

Nie możemy zagwarantować zwiększenia limitu żądań, ale dołożymy wszelkich starań, aby rozpatrzyć Twoją prośbę.