Hız sınırları

Hız sınırları, belirli bir zaman aralığında Gemini API'ye gönderebileceğiniz isteklerin sayısını düzenler. Bu sınırlar, adil kullanımı sürdürmeye, kötüye kullanıma karşı korumaya ve sistem performansını tüm kullanıcılar için korumaya yardımcı olur.

Sıklık sınırlarının işleyiş şekli

Hız sınırları genellikle üç boyutta ölçülür:

  • Dakika başına istek sayısı (RPM)
  • Dakikada jeton sayısı (giriş) (TPM)
  • Günlük istek sayısı (RPD)

Kullanımınız her sınıra göre değerlendirilir ve herhangi bir sınırı aşmanız durumunda sıklık sınırı hatası tetiklenir. Örneğin, RPM sınırınız 20 ise TPM veya diğer sınırlarınızı aşmamış olsanız bile bir dakika içinde 21 istekte bulunmanız hataya neden olur.

Hız sınırları API anahtarı başına değil, proje başına uygulanır.

Günlük istek (RPD) kotaları, Pasifik saatine göre gece yarısında sıfırlanır.

Sınırlar, kullanılan modele göre değişir ve bazı sınırlar yalnızca belirli modeller için geçerlidir. Örneğin, dakikadaki resim sayısı (IPM) yalnızca resim oluşturabilen modeller (Imagen 3) için hesaplanır ancak kavramsal olarak TPM'ye benzer. Diğer modellerde günlük jeton sınırı (TPD) olabilir.

Deneysel ve önizleme modellerinde hız sınırları daha kısıtlıdır.

Kullanım katmanları

Hız sınırları, projenin kullanım katmanına bağlıdır. API kullanımınız ve harcamanız arttıkça daha yüksek hız sınırlarına sahip bir plana geçiş yapabilirsiniz.

2. ve 3. katmanların şartları, projenize bağlı faturalandırma hesabında Google Cloud hizmetlerine (Gemini API dahil ancak bununla sınırlı olmamak üzere) yapılan toplam harcamaya göre belirlenir.

Katman Nitelikler
Ücretsiz Uygun ülkelerdeki kullanıcılar
Katman 1 Projeye bağlı faturalandırma hesabı
Katman 2 Toplam harcama: > 250 ABD doları ve başarılı ödemeden bu yana en az 30 gün geçmiş olmalıdır.
3. Katman Toplam harcama: > 1.000 ABD doları ve başarılı ödemeden bu yana en az 30 gün geçmiş olmalıdır.

Yükseltme isteğinde bulunduğunuzda otomatik kötüye kullanım koruma sistemimiz ek kontroller gerçekleştirir. Belirtilen uygunluk ölçütlerini karşılamak genellikle onay için yeterli olsa da nadir durumlarda, inceleme süreci sırasında belirlenen diğer faktörlere bağlı olarak yükseltme isteği reddedilebilir.

Bu sistem, Gemini API platformunun tüm kullanıcılar için güvenliğini ve bütünlüğünü korumaya yardımcı olur.

Standart API hız sınırları

Aşağıdaki tabloda, tüm standart Gemini API çağrıları için hız sınırları listelenmiştir.

Ücretsiz Katman

Model BGBG TPM RPD
Metin çıkışı modelleri
Gemini 2.5 Pro 5 250.000 100
Gemini 2.5 Flash 10 250.000 250
Gemini 2.5 Flash-Lite 15 250.000 1.000
Gemini 2.0 Flash 15 1.000.000 200
Gemini 2.0 Flash-Lite 30 1.000.000 200
Live API
Gemini 2.5 Flash Live 3 oturum 1.000.000 *
Gemini 2.5 Flash Önizlemesinde Yerel Ses 1 oturum 25.000 5
Gemini 2.5 Flash Experimental Native Audio Thinking 1 oturum 10.000 5
Gemini 2.0 Flash Live 3 oturum 1.000.000 *
Çok formatlı üretken modeller
Gemini 2.5 Flash Preview TTS 3 10.000 15
Gemini 2.0 Flash Önizlemesinde Görüntü Üretme 10 200.000 100
Diğer modeller
Gemma 3 ve 3n 30 15.000 14.400
Gemini Embedding 100 30.000 1.000
Kullanımdan kaldırılan modeller
Gemini 1.5 Flash (Desteği Sonlandırıldı) 15 250.000 50
Gemini 1.5 Flash-8B (Desteği Sonlandırıldı) 15 250.000 50

Katman 1

Model BGBG TPM RPD Toplu Sıraya Alınan Jetonlar
Metin çıkışı modelleri
Gemini 2.5 Pro 150 2.000.000 10.000 5.000.000
Gemini 2.5 Flash 1.000 1.000.000 10.000 3.000.000
Gemini 2.5 Flash-Lite 4.000 4.000.000 * 10.000.000
Gemini 2.0 Flash 2.000 4.000.000 * 10.000.000
Gemini 2.0 Flash-Lite 4.000 4.000.000 * 10.000.000
Live API
Gemini 2.5 Flash Live 50 oturum 4.000.000 * *
Gemini 2.5 Flash Önizlemesinde Yerel Ses 3 oturum 50.000 50 *
Gemini 2.5 Flash Experimental Native Audio Thinking 1 oturum 25.000 50 *
Gemini 2.0 Flash Live 50 oturum 4.000.000 * *
Çok formatlı üretken modeller
Gemini 2.5 Flash Preview TTS 10 10.000 100 *
Gemini 2.5 Pro Önizleme TTS 10 10.000 50 *
Gemini 2.5 Flash ile Görüntü Önizlemesi 500 500.000 2.000 *
Gemini 2.0 Flash Önizlemesinde Görüntü Üretme 1.000 1.000.000 10.000 *
Imagen 4 Standard/Fast 10 * 70 *
Imagen 4 Ultra 5 * 30 *
Imagen 3 20 * * *
Veo 3 2 * 10 *
Veo 3 Fast 2 * 10 *
Veo 2 2 * 50 *
Diğer modeller
Gemma 3 ve 3n 30 15.000 14.400 *
Gemini Embedding 3.000 1.000.000 * *
Kullanımdan kaldırılan modeller
Gemini 1.5 Flash (Desteği Sonlandırıldı) 2.000 4.000.000 * *
Gemini 1.5 Flash-8B (Desteği Sonlandırıldı) 4.000 4.000.000 * *
Gemini 1.5 Pro (Kullanımdan kaldırıldı) 1.000 4.000.000 * *

Katman 2

Model BGBG TPM RPD Toplu Sıraya Alınan Jetonlar
Metin çıkışı modelleri
Gemini 2.5 Pro 1.000 5.000.000 50.000 500.000.000
Gemini 2.5 Flash 2.000 3.000.000 100.000 400.000.000
Gemini 2.5 Flash-Lite 10.000 10.000.000 * 500.000.000
Gemini 2.0 Flash 10.000 10.000.000 * 1.000.000.000
Gemini 2.0 Flash-Lite 20.000 10.000.000 * 1.000.000.000
Live API
Gemini 2.5 Flash Live 1.000 oturum 10.000.000 * *
Gemini 2.5 Flash Önizlemesinde Yerel Ses 100 oturum 1.000.000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking 1 oturum 25.000 50 *
Gemini 2.0 Flash Live 1.000 oturum 10.000.000 * *
Çok formatlı üretken modeller
Gemini 2.5 Flash Preview TTS 1.000 100.000 10.000 *
Gemini 2.5 Pro Önizleme TTS 100 25.000 1.000 *
Gemini 2.5 Flash ile Görüntü Önizlemesi 2.000 1.500.000 50.000 *
Gemini 2.0 Flash Önizlemesinde Görüntü Üretme 2.000 3.000.000 100.000 *
Imagen 4 Standard/Fast 15 * 1000 *
Imagen 4 Ultra 10 * 400 *
Imagen 3 20 * * *
Veo 3 4 * 50 *
Veo 3 Fast 4 * 50 *
Veo 2 2 * 50 *
Diğer modeller
Gemma 3 ve 3n 30 15.000 14.400 *
Gemini Embedding 5.000 5.000.000 * *
Kullanımdan kaldırılan modeller
Gemini 1.5 Flash (Desteği Sonlandırıldı) 2.000 4.000.000 * *
Gemini 1.5 Flash-8B (Desteği Sonlandırıldı) 4.000 4.000.000 * *
Gemini 1.5 Pro (Kullanımdan kaldırıldı) 1.000 4.000.000 * *

3. Katman

Model BGBG TPM RPD Toplu Sıraya Alınan Jetonlar
Metin çıkışı modelleri
Gemini 2.5 Pro 2.000 8.000.000 * 1.000.000.000
Gemini 2.5 Flash 10.000 8.000.000 * 1.000.000.000
Gemini 2.5 Flash-Lite 30.000 30.000.000 * 1.000.000.000
Gemini 2.0 Flash 30.000 30.000.000 * 5.000.000.000
Gemini 2.0 Flash-Lite 30.000 30.000.000 * 5.000.000.000
Live API
Gemini 2.5 Flash Live 1.000 oturum 10.000.000 * *
Gemini 2.5 Flash Önizlemesinde Yerel Ses 100 oturum 1.000.000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking 1 oturum 25.000 50 *
Gemini 2.0 Flash Live 1.000 oturum 10.000.000 * *
Çok formatlı üretken modeller
Gemini 2.5 Flash Preview TTS 1.000 1.000.000 * *
Gemini 2.5 Pro Önizleme TTS 100 1.000.000 * *
Gemini 2.5 Flash ile Görüntü Önizlemesi 5.000 5.000.000 * *
Gemini 2.0 Flash Önizlemesinde Görüntü Üretme 5.000 5.000.000 * *
Imagen 4 Standard/Fast 20 * 15.000 *
Imagen 4 Ultra 15 * 5.000 *
Imagen 3 20 * * *
Veo 3 10 * 500 *
Veo 3 Fast 10 * 500 *
Veo 2 2 * 50 *
Diğer modeller
Gemma 3 ve 3n 30 15.000 14.400 *
Gemini Embedding 10.000 10.000.000 * *
Kullanımdan kaldırılan modeller
Gemini 1.5 Flash (Desteği Sonlandırıldı) 2.000 4.000.000 * *
Gemini 1.5 Flash-8B (Desteği Sonlandırıldı) 4.000 4.000.000 * *
Gemini 1.5 Pro (Kullanımdan kaldırıldı) 1.000 4.000.000 * *

Belirtilen hız sınırları garanti edilmez ve gerçek kapasite farklılık gösterebilir.

Batch API hız sınırları

Toplu API istekleri, toplu olmayan API çağrılarından ayrı olarak kendi hız sınırlarına tabidir.

  • Eşzamanlı toplu istek sayısı: 100
  • Giriş dosyasının boyutu sınırı: 2 GB
  • Dosya depolama alanı sınırı: 20 GB
  • Model başına sıraya alınan jetonlar: Sınır tablosundaki Toplu İşleme İçin Sıraya Alınan Jetonlar sütununda, belirli bir model için tüm etkin toplu işlerinizde toplu işleme için sıraya alınabilecek maksimum jeton sayısı listelenir. Standart API sıklık sınırları tablosunda görebilirsiniz.

Bir sonraki katmana nasıl geçilir?

Gemini API, tüm faturalandırma hizmetleri için Cloud Faturalandırma'yı kullanır. Ücretsiz katmandan ücretli katmana geçmek için önce Google Cloud projenizde Cloud Faturalandırma'yı etkinleştirmeniz gerekir.

Projeniz belirtilen ölçütleri karşıladığında bir sonraki katmana yükseltilmeye uygun hale gelir. Yükseltme isteğinde bulunmak için aşağıdaki adımları uygulayın:

Hızlı bir doğrulamanın ardından proje bir sonraki katmana yükseltilir.

Oran sınırı artışı isteğinde bulunma

Her model varyasyonunun ilişkili bir sıklık sınırı (dakikadaki istek sayısı, RPM) vardır. Bu sıklık sınırları hakkında ayrıntılı bilgi için Gemini modelleri başlıklı makaleyi inceleyin.

Ücretli katman için istek oranı sınırı artışı isteme

Hız sınırınızı artıracağımız konusunda garanti veremeyiz ancak isteğinizi incelemek için elimizden geleni yapacağız.