Ograniczenia częstotliwości określają liczbę żądań, które możesz wysyłać do interfejsu Gemini API w określonym przedziale czasu. Te limity pomagają zapewnić uczciwe korzystanie z usługi, chronią przed nadużywaniem i pomagają w utrzymywaniu wydajności systemu dla wszystkich użytkowników.
Jak działają limity szybkości
Limity szybkości są mierzone w 3 wymiarach:
- Żądania na minutę (RPM)
- Żądania dziennie (RPD)
- Tokeny na minutę (TPM)
Twoje wykorzystanie jest oceniane na podstawie każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd limitu szybkości. Jeśli np. Twój limit RPM wynosi 20, wysłanie 21 żądań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.
Limity szybkości są stosowane na poziomie projektu, a nie klucza interfejsu API.
Limity różnią się w zależności od konkretnego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli zdolnych do generowania obrazów (obraz 3), ale pod względem koncepcyjnym jest podobna do TPM.
Poziomy wykorzystania
Limity szybkości są powiązane z poziomem wykorzystania projektu (który wkrótce wprowadzimy). W miarę zwiększania się użycia interfejsu API i wydatków możesz przejść na wyższy poziom z wyższymi limitami szybkości.
Poziom | Kwalifikacje |
---|---|
Wersja bezpłatna | Użytkownicy w kwalifikujących się krajach |
Poziom 1 | Konto rozliczeniowe połączone z projektem |
Poziom 2 | Łączne wydatki: 250 USD + co najmniej 30 dni od daty udanej płatności |
Poziom 3 | Jeszcze niedostępne, wkrótce dostępne. |
Gdy żądasz uaktualnienia, nasz automatyczny system ochrony przed nadużyciami przeprowadza dodatkowe kontrole. Chociaż spełnienie określonych kryteriów kwalifikacji jest zazwyczaj wystarczające do uzyskania zatwierdzenia, w rzadkich przypadkach prośba o przeniesienie może zostać odrzucona ze względu na inne czynniki zidentyfikowane podczas procesu weryfikacji.
System ten pomaga zapewnić bezpieczeństwo i integralność platformy Gemini API dla wszystkich użytkowników.
Bieżące ograniczenia szybkości
Model | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 15 | 1 000 000 | 1500 |
Gemini 2.0 Flash Experimental | 10 | 1 000 000 | 1500 |
Gemini 2.0 Flash-Lite | 30 | 1 000 000 | 1500 |
Gemini 2.0 Pro Experimental 02-05 | 2 | 1 000 000 | 50 |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4 000 000 | 1500 |
Gemini 1.5 Flash | 15 | 1 000 000 | 1500 |
Gemini 1.5 Flash-8B | 15 | 1 000 000 | 1500 |
Gemini 1.5 Pro | 2 | 32 000 | 50 |
Imagen 3 | -- | -- | -- |
Gemma 3 | 30 | 15 000 | 14 400 |
Gemini Embedding Experimental 03-07 | 5 | -- | 100 |
Model | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 2000 | 4 000 000 | -- |
Gemini 2.0 Flash Experimental | 10 | 4 000 000 | -- |
Gemini 2.0 Flash-Lite | 4000 | 4 000 000 | -- |
Gemini 2.0 Pro Experimental 02-05 | 5 | 1 000 000 | -- |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4 000 000 | -- |
Gemini 1.5 Flash | 2000 | 4 000 000 | -- |
Gemini 1.5 Flash-8B | 4000 | 4 000 000 | -- |
Gemini 1.5 Pro | 1000 | 4 000 000 | -- |
Imagen 3 | -- | 20 obrazów na minutę (IPM) | -- |
Gemma 3 | -- | -- | -- |
Gemini Embedding Experimental 03-07 | 10 | -- | 1000 |
Model | RPM | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 10 000 | 10 000 000 | -- |
Gemini 2.0 Flash-Lite | 4000 | 4 000 000 | -- |
Gemini 2.0 Pro Experimental 02-05 | 5 | 1 000 000 | -- |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4 000 000 | -- |
Gemini 1.5 Flash | 2000 | 4 000 000 | -- |
Gemini 1.5 Flash-8B | 4000 | 4 000 000 | -- |
Gemini 1.5 Pro | 1000 | 4 000 000 | -- |
Imagen 3 | -- | 20 obrazów na minutę (IPM) | -- |
Gemini Embedding Experimental 03-07 | 10 | -- | 1000 |
Określone limity szybkości nie są gwarantowane, a rzeczywista przepustowość może się różnić.
Jak przejść na wyższy poziom
Interfejs Gemini API korzysta z Cloud Billing do obsługi wszystkich usług płatności. Aby przejść z poziomu bezpłatnego na płatny, musisz najpierw włączyć Płatności w chmurze w projekcie Google Cloud.
Gdy projekt spełnia określone kryteria, kwalifikuje się do przejścia na wyższy poziom. Aby poprosić o przekształcenie konta, wykonaj te czynności:
- Otwórz w AI Studio stronę kluczy interfejsu API.
- Odszukaj projekt, który chcesz przenieść na wyższy abonament, i kliknij „Przeniesienie”. Opcja „Uaktualnij” będzie widoczna tylko w przypadku projektów spełniających kryteria kolejnego poziomu.
Po szybkiej weryfikacji projekt zostanie przeniesiony na wyższy poziom.
Wysyłanie prośby o zwiększenie limitu częstotliwości
Każda wersja modelu ma powiązany limit szybkości (żądania na minutę, RPM). Szczegółowe informacje o tych limitach znajdziesz w artykule Modele Gemini.
Poproś o zwiększenie limitu stawek w przypadku płatnego poziomu
Nie możemy zagwarantować zwiększenia limitu stawki, ale dołożymy wszelkich starań, aby rozpatrzyć Twoją prośbę i skontaktować się z Tobą, jeśli będziemy w stanie spełnić Twoje potrzeby dotyczące przepustowości.