Hız sınırları

Hız sınırları, belirli bir zaman aralığında Gemini API'ye gönderebileceğiniz istek sayısını düzenler. Bu sınırlar, adil kullanımı sürdürmeye, kötüye kullanıma karşı korumaya ve sistem performansını tüm kullanıcılar için korumaya yardımcı olur.

AI Studio'da etkin hız sınırlarınızı görüntüleme

Sıklık sınırlarının işleyiş şekli

Hız sınırları genellikle üç boyutta ölçülür:

  • Dakikada istek sayısı (RPM)
  • Dakikada jeton sayısı (giriş) (TPM)
  • Günlük istek sayısı (RPD)

Kullanımınız her sınıra göre değerlendirilir ve herhangi bir sınırı aşmanız durumunda sıklık sınırı hatası tetiklenir. Örneğin, RPM sınırınız 20 ise TPM veya diğer sınırlarınızı aşmamış olsanız bile bir dakika içinde 21 istekte bulunmanız hataya neden olur.

Hız sınırları API anahtarı başına değil, proje başına uygulanır. Günlük istek sayısı (RPD) kotaları, Pasifik saatine göre gece yarısında sıfırlanır.

Sınırlar, kullanılan modele göre değişir ve bazı sınırlar yalnızca belirli modeller için geçerlidir. Örneğin, dakikadaki resim sayısı (IPM) yalnızca resim oluşturabilen modeller (Imagen 3) için hesaplanır ancak kavramsal olarak TPM'ye benzer. Diğer modellerde günlük jeton sınırı (TPD) olabilir.

Deneysel ve önizleme modellerinde hız sınırları daha kısıtlıdır.

Kullanım katmanları

Hız sınırları, projenin kullanım katmanına bağlıdır. API kullanımınız ve harcamanız arttıkça daha yüksek hız sınırlarına sahip daha üst bir katmana geçme seçeneğiniz olur.

2. ve 3. katmanların koşulları, projenize bağlı faturalandırma hesabı için Google Cloud hizmetlerine (Gemini API dahil ancak bununla sınırlı olmamak üzere) yapılan toplam kümülatif harcamaya dayanır.

Katman Nitelikler
Ücretsiz Uygun ülkelerdeki kullanıcılar
Katman 1 Projeye bağlı, ödemesi tam olarak yapılmış bir faturalandırma hesabı
Katman 2 Toplam harcama: > 250 ABD doları ve başarılı ödemeden bu yana en az 30 gün geçmiş olmalıdır.
3. Katman Toplam harcama: > 1.000 ABD doları ve başarılı ödemeden bu yana en az 30 gün geçmiş olmalıdır.

Yükseltme isteğinde bulunduğunuzda otomatik kötüye kullanım koruma sistemimiz ek kontroller gerçekleştirir. Belirtilen uygunluk ölçütlerini karşılamak genellikle onay için yeterli olsa da nadir durumlarda, inceleme süreci sırasında belirlenen diğer faktörlere bağlı olarak yükseltme isteği reddedilebilir.

Bu sistem, Gemini API platformunun tüm kullanıcılar için güvenliğini ve bütünlüğünü korumaya yardımcı olur.

Gemini API hız sınırları

Hız sınırları çeşitli faktörlere (ör. kota katmanınız) bağlıdır ve Google AI Studio'da görüntülenebilir. Zaman içinde katmanınız ve hesap durumunuz değiştikçe hız sınırlarınız otomatik olarak güncellenir.

AI Studio'da etkin hız sınırlarınızı görüntüleme

Belirtilen hız sınırları garanti edilmez ve gerçek kapasite farklılık gösterebilir.

Batch API hız sınırları

Toplu API istekleri, toplu olmayan API çağrılarından ayrı olarak kendi hız sınırlarına tabidir.

  • Eşzamanlı toplu istekler: 100
  • Giriş dosyasının boyut sınırı: 2 GB
  • Dosya depolama alanı sınırı: 20 GB
  • Model başına sıraya alınan jetonlar: Hız sınırı tablosundaki Toplu İşleme İçin Sıraya Alınan Jetonlar sütununda, belirli bir model için tüm etkin toplu işlerinizde toplu işleme için sıraya alınabilecek maksimum jeton sayısı listelenir. Standart API sıklık sınırları tablosunda görebilirsiniz.

Katman 1

Model Toplu Sıraya Alınan Jetonlar
Metin çıkışı modelleri
Gemini 3 Pro Önizlemesi 50.000.000
Gemini 2.5 Pro 5.000.000
Gemini 2.5 Flash 3.000.000
Gemini 2.5 Flash Önizlemesi 3.000.000
Gemini 2.5 Flash-Lite 10.000.000
Gemini 2.5 Flash-Lite Önizlemesi 10.000.000
Gemini 2.0 Flash 10.000.000
Gemini 2.0 Flash-Lite 10.000.000
Çok formatlı üretken modeller
Gemini 3 Pro Görüntü Önizlemesi 🍌 2.000.000

Katman 2

Model Toplu Sıraya Alınan Jetonlar
Metin çıkışı modelleri
Gemini 3 Pro Önizlemesi 500.000.000
Gemini 2.5 Pro 500.000.000
Gemini 2.5 Flash 400.000.000
Gemini 2.5 Flash Önizlemesi 400.000.000
Gemini 2.5 Flash-Lite 500.000.000
Gemini 2.5 Flash-Lite Önizlemesi 500.000.000
Gemini 2.0 Flash 1.000.000.000
Gemini 2.0 Flash-Lite 1.000.000.000
Çok formatlı üretken modeller
Gemini 3 Pro Görüntü Önizlemesi 🍌 270.000.000

3. Katman

Toplu Sıraya Alınan Jetonlar
Metin çıkışı modelleri
Gemini 3 Pro Önizlemesi 1.000.000.000
Gemini 2.5 Pro 1.000.000.000
Gemini 2.5 Flash 1.000.000.000
Gemini 2.5 Flash Önizlemesi 1.000.000.000
Gemini 2.5 Flash-Lite 1.000.000.000
Gemini 2.5 Flash-Lite Önizlemesi 1.000.000.000
Gemini 2.0 Flash 5.000.000.000
Gemini 2.0 Flash-Lite 5.000.000.000
Çok formatlı üretken modeller
Gemini 3 Pro Görüntü Önizlemesi 🍌 5.000 5.000.000 * 1.000.000.000

Bir sonraki katmana yükseltme

Gemini API, tüm faturalandırma hizmetleri için Cloud Faturalandırma'yı kullanır. Ücretsiz katmandan ücretli bir katmana geçmek için önce Google Cloud projenizde Cloud Faturalandırma'yı etkinleştirmeniz gerekir.

Projeniz belirtilen ölçütleri karşıladığında bir sonraki katmana yükseltilmeye uygun hale gelir. Yükseltme isteğinde bulunmak için aşağıdaki adımları uygulayın:

Hızlı bir doğrulamanın ardından proje bir sonraki katmana yükseltilir.

Oran sınırı artışı isteğinde bulunma

Her model varyasyonunun ilişkili bir sıklık sınırı (dakikada istek sayısı, RPM) vardır. Bu sıklık sınırları hakkında ayrıntılı bilgi için Gemini modelleri başlıklı makaleyi inceleyin.

Ücretli katman için istek oranı sınırı artışı isteğinde bulunma

Hız sınırınızı artıracağımız konusunda garanti veremeyiz ancak isteğinizi incelemek için elimizden geleni yapacağız.