Limity liczby żądań regulują liczbę żądań, które możesz wysyłać do interfejsu Gemini API w określonym czasie. Te limity pomagają zachować uczciwe korzystanie z usługi, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.
Wyświetlanie aktywnych limitów w AI Studio
Jak działają limity szybkości
Limity szybkości są zwykle mierzone w 3 wymiarach:
- Żądania na minutę (RPM)
 - Tokeny na minutę (dane wejściowe) (TPM)
 - Żądania dziennie (RPD)
 
Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd limitu szybkości. Jeśli na przykład limit RPM wynosi 20, wysłanie 21 żądań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.
Limity liczby żądań są stosowane w przypadku poszczególnych projektów, a nie kluczy interfejsu API.
Limity RPD są resetowane o północy czasu pacyficznego.
Limity różnią się w zależności od używanego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli, które mogą generować obrazy (Imagen 3), ale jest podobna do liczby tokenów na minutę (TPM). Inne modele mogą mieć limit tokenów na dzień (TPD).
W przypadku modeli eksperymentalnych i wersji testowych limity są bardziej restrykcyjne.
Kategorie wykorzystania
Limity liczby żądań są powiązane z poziomem wykorzystania projektu. Wraz ze wzrostem wykorzystania interfejsu API i wydatków będziesz mieć możliwość przejścia na wyższy poziom z większymi limitami liczby żądań.
Kryteria kwalifikacji do poziomów 2 i 3 są oparte na łącznych wydatkach na usługi Google Cloud (w tym na interfejs Gemini API) na koncie rozliczeniowym połączonym z Twoim projektem.
| Typ | Kwalifikacje | 
|---|---|
| Bezpłatnie | Użytkownicy w kwalifikujących się krajach | 
| Poziom 1 | Konto rozliczeniowe połączone z projektem | 
| Poziom 2 | Łączne wydatki: > 250 USD i co najmniej 30 dni od pomyślnej płatności | 
| Poziom 3 | Łączne wydatki: > 1000 PLN i co najmniej 30 dni od pomyślnej płatności | 
Gdy poprosisz o przejście na wyższą wersję, nasz automatyczny system ochrony przed nadużyciami przeprowadzi dodatkowe kontrole. Spełnienie podanych kryteriów kwalifikacji jest zwykle wystarczające do zatwierdzenia, ale w rzadkich przypadkach prośba o przejście na wyższy poziom może zostać odrzucona z powodu innych czynników wykrytych podczas procesu weryfikacji.
Ten system pomaga zachować bezpieczeństwo i integralność platformy Gemini API dla wszystkich użytkowników.
Standardowe limity częstotliwości żądań interfejsu API
W tabeli poniżej znajdziesz limity liczby żądań dla wszystkich standardowych wywołań interfejsu Gemini API.
poziom bezpłatny
| Model | RPM | TPM | RPD | 
|---|---|---|---|
| Modele tekstowe | |||
| Gemini 2.5 Pro | 2 | 125 000 | 50 | 
| Gemini 2.5 Flash | 10 | 250 000 | 250 | 
| Wersja testowa Gemini 2.5 Flash | 10 | 250 000 | 250 | 
| Gemini 2.5 Flash-Lite | 15 | 250 000 | 1000 | 
| Wersja testowa Gemini 2.5 Flash-Lite | 15 | 250 000 | 1000 | 
| Gemini 2.0 Flash | 15 | 1 000 000 | 200 | 
| Gemini 2.0 Flash-Lite | 30 | 1 000 000 | 200 | 
| Interfejs Live API | |||
| Gemini 2.5 Flash Live | * | 1 000 000 | * | 
| Wersja testowa Gemini 2.5 Flash – natywne audio | * | 500 000 | * | 
| Gemini 2.0 Flash Live | * | 1 000 000 | * | 
| Modele generowania multimodalnego | |||
| Wersja testowa Gemini 2.5 Flash TTS | 3 | 10 000 | 15 | 
| Generowanie obrazów w wersji podglądowej Gemini 2.0 Flash | 10 | 200 000 | 100 | 
| Inne modele | |||
| Gemma 3 i 3n | 30 | 15 000 | 14 400 | 
| Osadzanie Gemini | 100 | 30 000 | 1000 | 
| Wersja testowa Gemini Robotics-ER 1.5 | 10 | 250 000 | 250 | 
| Wycofane modele | |||
| Gemini 1.5 Flash (wycofany) | 15 | 250 000 | 50 | 
| Gemini 1.5 Flash-8B (wycofany) | 15 | 250 000 | 50 | 
Poziom 1
| Model | RPM | TPM | RPD | Tokeny w kolejce w przypadku przetwarzania zbiorczego | 
|---|---|---|---|---|
| Modele tekstowe | ||||
| Gemini 2.5 Pro | 150 | 2 000 000 | 10 000 | 5 000 000 | 
| Gemini 2.5 Flash | 1000 | 1 000 000 | 10 000 | 3 000 000 | 
| Wersja testowa Gemini 2.5 Flash | 1000 | 1 000 000 | 10 000 | 3 000 000 | 
| Gemini 2.5 Flash-Lite | 4000 | 4 000 000 | * | 10 000 000 | 
| Wersja testowa Gemini 2.5 Flash-Lite | 4000 | 4 000 000 | * | 10 000 000 | 
| Gemini 2.0 Flash | 2000 | 4 000 000 | * | 10 000 000 | 
| Gemini 2.0 Flash-Lite | 4000 | 4 000 000 | * | 10 000 000 | 
| Interfejs Live API | ||||
| Gemini 2.5 Flash Live | 50 sesji | 4 000 000 | * | * | 
| Wersja testowa Gemini 2.5 Flash – natywne audio | * | 1 000 000 | * | * | 
| Gemini 2.0 Flash Live | 50 sesji | 4 000 000 | * | * | 
| Modele generowania multimodalnego | ||||
| Wersja testowa Gemini 2.5 Flash TTS | 10 | 10 000 | 100 | * | 
| Wersja testowa Gemini 2.5 Pro TTS | 10 | 10 000 | 50 | * | 
| Obraz Gemini 2.5 Flash | 500 | 500 000 | 2000 | * | 
| Generowanie obrazów w wersji podglądowej Gemini 2.0 Flash | 1000 | 1 000 000 | 10 000 | * | 
| Imagen 4 Standard/Fast | 10 | * | 70 | * | 
| Imagen 4 Ultra | 5 | * | 30 | * | 
| Imagen 3 | 20 | * | * | * | 
| Veo 3.1 | 2 | * | 10 | * | 
| Veo 3.1 Fast | 2 | * | 10 | * | 
| Veo 3 | 2 | * | 10 | * | 
| Veo 3 Fast | 2 | * | 10 | * | 
| Veo 2 | 2 | * | 50 | * | 
| Inne modele | ||||
| Gemma 3 i 3n | 30 | 15 000 | 14 400 | * | 
| Osadzanie Gemini | 3000 | 1 000 000 | * | * | 
| Wersja testowa Gemini Robotics-ER 1.5 | 300 | 1 000 000 | 10 000 | * | 
| Wersja testowa Gemini 2.5 do użytku na komputerze | 150 | 2 000 000 | 10 000 | * | 
| Wycofane modele | ||||
| Gemini 1.5 Flash (wycofany) | 2000 | 4 000 000 | * | * | 
| Gemini 1.5 Flash-8B (wycofany) | 4000 | 4 000 000 | * | * | 
| Gemini 1.5 Pro (wycofany) | 1000 | 4 000 000 | * | * | 
Poziom 2
| Model | RPM | TPM | RPD | Tokeny w kolejce w przypadku przetwarzania zbiorczego | 
|---|---|---|---|---|
| Modele tekstowe | ||||
| Gemini 2.5 Pro | 1000 | 5 000 000 | 50 000 | 500 000 000 | 
| Gemini 2.5 Flash | 2000 | 3 000 000 | 100 000 | 400 000 000 | 
| Wersja testowa Gemini 2.5 Flash | 2000 | 3 000 000 | 100 000 | 400 000 000 | 
| Gemini 2.5 Flash-Lite | 10 000 | 10 000 000 | * | 500 000 000 | 
| Wersja testowa Gemini 2.5 Flash-Lite | 10 000 | 10 000 000 | * | 500 000 000 | 
| Gemini 2.0 Flash | 10 000 | 10 000 000 | * | 1 000 000 000 | 
| Gemini 2.0 Flash-Lite | 20 000 | 10 000 000 | * | 1 000 000 000 | 
| Interfejs Live API | ||||
| Gemini 2.5 Flash Live | 1000 sesji | 10 000 000 | * | * | 
| Wersja testowa Gemini 2.5 Flash – natywne audio | * | 10 000 000 | * | * | 
| Gemini 2.0 Flash Live | 1000 sesji | 10 000 000 | * | * | 
| Modele generowania multimodalnego | ||||
| Wersja testowa Gemini 2.5 Flash TTS | 1000 | 100 000 | 10 000 | * | 
| Wersja testowa Gemini 2.5 Pro TTS | 100 | 25 000 | 1000 | * | 
| Obraz Gemini 2.5 Flash | 2000 | 1 500 000 | 50 000 | * | 
| Generowanie obrazów w wersji podglądowej Gemini 2.0 Flash | 2000 | 3 000 000 | 100 000 | * | 
| Imagen 4 Standard/Fast | 15 | * | 1000 | * | 
| Imagen 4 Ultra | 10 | * | 400 | * | 
| Imagen 3 | 20 | * | * | * | 
| Veo 3.1 | 4 | * | 50 | * | 
| Veo 3.1 Fast | 4 | * | 50 | * | 
| Veo 3 | 4 | * | 50 | * | 
| Veo 3 Fast | 4 | * | 50 | * | 
| Veo 2 | 2 | * | 50 | * | 
| Inne modele | ||||
| Gemma 3 i 3n | 30 | 15 000 | 14 400 | * | 
| Osadzanie Gemini | 5000 | 5 000 000 | * | * | 
| Wersja testowa Gemini Robotics-ER 1.5 | 400 | 3 000 000 | 100 000 | * | 
| Wersja testowa Gemini 2.5 do użytku na komputerze | 1000 | 5 000 000 | 50 000 | * | 
| Wycofane modele | ||||
| Gemini 1.5 Flash (wycofany) | 2000 | 4 000 000 | * | * | 
| Gemini 1.5 Flash-8B (wycofany) | 4000 | 4 000 000 | * | * | 
| Gemini 1.5 Pro (wycofany) | 1000 | 4 000 000 | * | * | 
Poziom 3
| Model | RPM | TPM | RPD | Tokeny w kolejce w przypadku przetwarzania zbiorczego | 
|---|---|---|---|---|
| Modele tekstowe | ||||
| Gemini 2.5 Pro | 2000 | 8 000 000 | * | 1 000 000 000 | 
| Gemini 2.5 Flash | 10 000 | 8 000 000 | * | 1 000 000 000 | 
| Wersja testowa Gemini 2.5 Flash | 10 000 | 8 000 000 | * | 1 000 000 000 | 
| Gemini 2.5 Flash-Lite | 30 000 | 30 000 000 | * | 1 000 000 000 | 
| Wersja testowa Gemini 2.5 Flash-Lite | 30 000 | 30 000 000 | * | 1 000 000 000 | 
| Gemini 2.0 Flash | 30 000 | 30 000 000 | * | 5 000 000 000 | 
| Gemini 2.0 Flash-Lite | 30 000 | 30 000 000 | * | 5 000 000 000 | 
| Interfejs Live API | ||||
| Gemini 2.5 Flash Live | 1000 sesji | 10 000 000 | * | * | 
| Wersja testowa Gemini 2.5 Flash – natywne audio | * | 10 000 000 | * | * | 
| Gemini 2.0 Flash Live | 1000 sesji | 10 000 000 | * | * | 
| Modele generowania multimodalnego | ||||
| Wersja testowa Gemini 2.5 Flash TTS | 1000 | 1 000 000 | * | * | 
| Wersja testowa Gemini 2.5 Pro TTS | 100 | 1 000 000 | * | * | 
| Obraz Gemini 2.5 Flash | 5000 | 5 000 000 | * | * | 
| Generowanie obrazów w wersji podglądowej Gemini 2.0 Flash | 5000 | 5 000 000 | * | * | 
| Imagen 4 Standard/Fast | 20 | * | 15 000 | * | 
| Imagen 4 Ultra | 15 | * | 5000 | * | 
| Imagen 3 | 20 | * | * | * | 
| Veo 3.1 | 10 | * | 500 | * | 
| Veo 3.1 Fast | 10 | * | 500 | * | 
| Veo 3 | 10 | * | 500 | * | 
| Veo 3 Fast | 10 | * | 500 | * | 
| Veo 2 | 2 | * | 50 | * | 
| Inne modele | ||||
| Gemma 3 i 3n | 30 | 15 000 | 14 400 | * | 
| Osadzanie Gemini | 10 000 | 10 000 000 | * | * | 
| Wersja testowa Gemini Robotics-ER 1.5 | 600 | 8 000 000 | * | *1 000 000 000* | 
| Wersja testowa Gemini 2.5 do użytku na komputerze | 2000 | 8 000 000 | * | * | 
| Wycofane modele | ||||
| Gemini 1.5 Flash (wycofany) | 2000 | 4 000 000 | * | * | 
| Gemini 1.5 Flash-8B (wycofany) | 4000 | 4 000 000 | * | * | 
| Gemini 1.5 Pro (wycofany) | 1000 | 4 000 000 | * | * | 
Określone limity szybkości nie są gwarantowane, a rzeczywista przepustowość może się różnić.
Limity częstotliwości żądań interfejsu Batch API
Żądania interfejsu Batch API podlegają własnym limitom liczby żądań, które są niezależne od wywołań interfejsu API niebędących żądaniami zbiorczymi.
- Równoczesne żądania zbiorcze: 100
 - Limit rozmiaru pliku wejściowego: 2 GB
 - Limit miejsca na pliki: 20 GB
 - Tokeny w kolejce według modelu: kolumna Tokeny w kolejce w przypadku przetwarzania wsadowego w tabeli limitów szybkości zawiera maksymalną liczbę tokenów, które można umieścić w kolejce do przetwarzania wsadowego we wszystkich aktywnych zadaniach wsadowych dla danego modelu. Znajdziesz je w tabeli standardowych limitów interfejsu API.
 
Jak przejść na wyższy poziom
Interfejs Gemini API korzysta z Cloud Billing w przypadku wszystkich usług rozliczeniowych. Aby przejść z poziomu bezpłatnego na płatny, musisz najpierw włączyć płatności Cloud w swoim projekcie Google Cloud.
Gdy Twój projekt spełni określone kryteria, będzie kwalifikować się do przejścia na wyższy poziom. Aby poprosić o przekształcenie:
- Otwórz stronę kluczy interfejsów API w AI Studio.
 - Znajdź projekt, który chcesz uaktualnić, i kliknij „Uaktualnij”. Opcja „Uaktualnij” będzie widoczna tylko w przypadku projektów, które spełniają wymagania dotyczące kolejnego poziomu.
 
Po szybkiej weryfikacji projekt zostanie uaktualniony do następnego poziomu.
Prośba o zwiększenie limitu częstotliwości
Każda odmiana modelu ma powiązany limit szybkości (żądania na minutę, RPM). Szczegółowe informacje o tych limitach znajdziesz w sekcji Modele Gemini.
Prośba o zwiększenie limitu częstotliwości w przypadku wersji płatnej
Nie możemy zagwarantować zwiększenia limitu, ale dołożymy wszelkich starań, aby rozpatrzyć Twoją prośbę.