Hız sınırları, belirli bir zaman aralığında Gemini API'ye gönderebileceğiniz istek sayısını düzenler. Bu sınırlar, adil kullanımı sürdürmeye, kötüye kullanıma karşı korumaya ve sistem performansını tüm kullanıcılar için korumaya yardımcı olur.
AI Studio'da etkin hız sınırlarınızı görüntüleme
Sıklık sınırlarının işleyiş şekli
Hız sınırları genellikle üç boyutta ölçülür:
- Dakikada istek sayısı (RPM)
- Dakikada jeton sayısı (giriş) (TPM)
- Günlük istek sayısı (RPD)
Kullanımınız her sınıra göre değerlendirilir ve herhangi bir sınırı aşmanız durumunda sıklık sınırı hatası tetiklenir. Örneğin, RPM sınırınız 20 ise TPM veya diğer sınırlarınızı aşmamış olsanız bile bir dakika içinde 21 istekte bulunmanız hataya neden olur.
Hız sınırları API anahtarı başına değil, proje başına uygulanır. Günlük istek sayısı (RPD) kotaları, Pasifik saatine göre gece yarısında sıfırlanır.
Sınırlar, kullanılan modele göre değişir ve bazı sınırlar yalnızca belirli modeller için geçerlidir. Örneğin, dakikadaki resim sayısı (IPM) yalnızca resim oluşturabilen modeller (Imagen 3) için hesaplanır ancak kavramsal olarak TPM'ye benzer. Diğer modellerde günlük jeton sınırı (TPD) olabilir.
Deneysel ve önizleme modellerinde hız sınırları daha kısıtlıdır.
Kullanım katmanları
Hız sınırları, projenin kullanım katmanına bağlıdır. API kullanımınız ve harcamanız arttıkça daha yüksek hız sınırlarına sahip daha üst bir katmana geçme seçeneğiniz olur.
2. ve 3. katmanların koşulları, projenize bağlı faturalandırma hesabı için Google Cloud hizmetlerine (Gemini API dahil ancak bununla sınırlı olmamak üzere) yapılan toplam kümülatif harcamaya dayanır.
| Katman | Nitelikler |
|---|---|
| Ücretsiz | Uygun ülkelerdeki kullanıcılar |
| Katman 1 | Projeye bağlı, ödemesi tam olarak yapılmış bir faturalandırma hesabı |
| Katman 2 | Toplam harcama: > 250 ABD doları ve başarılı ödemeden bu yana en az 30 gün geçmiş olmalıdır. |
| 3. Katman | Toplam harcama: > 1.000 ABD doları ve başarılı ödemeden bu yana en az 30 gün geçmiş olmalıdır. |
Yükseltme isteğinde bulunduğunuzda otomatik kötüye kullanım koruma sistemimiz ek kontroller gerçekleştirir. Belirtilen uygunluk ölçütlerini karşılamak genellikle onay için yeterli olsa da nadir durumlarda, inceleme süreci sırasında belirlenen diğer faktörlere bağlı olarak yükseltme isteği reddedilebilir.
Bu sistem, Gemini API platformunun tüm kullanıcılar için güvenliğini ve bütünlüğünü korumaya yardımcı olur.
Gemini API hız sınırları
Hız sınırları çeşitli faktörlere (ör. kota katmanınız) bağlıdır ve Google AI Studio'da görüntülenebilir. Zaman içinde katmanınız ve hesap durumunuz değiştikçe hız sınırlarınız otomatik olarak güncellenir.
AI Studio'da etkin hız sınırlarınızı görüntüleme
Belirtilen hız sınırları garanti edilmez ve gerçek kapasite farklılık gösterebilir.
Batch API hız sınırları
Toplu API istekleri, toplu olmayan API çağrılarından ayrı olarak kendi hız sınırlarına tabidir.
- Eşzamanlı toplu istekler: 100
- Giriş dosyasının boyut sınırı: 2 GB
- Dosya depolama alanı sınırı: 20 GB
- Model başına sıraya alınan jetonlar: Hız sınırı tablosundaki Toplu İşleme İçin Sıraya Alınan Jetonlar sütununda, belirli bir model için tüm etkin toplu işlerinizde toplu işleme için sıraya alınabilecek maksimum jeton sayısı listelenir. Standart API sıklık sınırları tablosunda görebilirsiniz.
Katman 1
| Model | Toplu Sıraya Alınan Jetonlar | |||
|---|---|---|---|---|
| Metin çıkışı modelleri | ||||
| Gemini 3 Pro Önizlemesi | 50.000.000 | |||
| Gemini 2.5 Pro | 5.000.000 | |||
| Gemini 2.5 Flash | 3.000.000 | |||
| Gemini 2.5 Flash Önizlemesi | 3.000.000 | |||
| Gemini 2.5 Flash-Lite | 10.000.000 | |||
| Gemini 2.5 Flash-Lite Önizlemesi | 10.000.000 | |||
| Gemini 2.0 Flash | 10.000.000 | |||
| Gemini 2.0 Flash-Lite | 10.000.000 | |||
| Çok formatlı üretken modeller | ||||
| Gemini 3 Pro Görüntü Önizlemesi 🍌 | 2.000.000 | |||
Katman 2
| Model | Toplu Sıraya Alınan Jetonlar | |||
|---|---|---|---|---|
| Metin çıkışı modelleri | ||||
| Gemini 3 Pro Önizlemesi | 500.000.000 | |||
| Gemini 2.5 Pro | 500.000.000 | |||
| Gemini 2.5 Flash | 400.000.000 | |||
| Gemini 2.5 Flash Önizlemesi | 400.000.000 | |||
| Gemini 2.5 Flash-Lite | 500.000.000 | |||
| Gemini 2.5 Flash-Lite Önizlemesi | 500.000.000 | |||
| Gemini 2.0 Flash | 1.000.000.000 | |||
| Gemini 2.0 Flash-Lite | 1.000.000.000 | |||
| Çok formatlı üretken modeller | ||||
| Gemini 3 Pro Görüntü Önizlemesi 🍌 | 270.000.000 | |||
3. Katman
| Toplu Sıraya Alınan Jetonlar | ||||
|---|---|---|---|---|
| Metin çıkışı modelleri | ||||
| Gemini 3 Pro Önizlemesi | 1.000.000.000 | |||
| Gemini 2.5 Pro | 1.000.000.000 | |||
| Gemini 2.5 Flash | 1.000.000.000 | |||
| Gemini 2.5 Flash Önizlemesi | 1.000.000.000 | |||
| Gemini 2.5 Flash-Lite | 1.000.000.000 | |||
| Gemini 2.5 Flash-Lite Önizlemesi | 1.000.000.000 | |||
| Gemini 2.0 Flash | 5.000.000.000 | |||
| Gemini 2.0 Flash-Lite | 5.000.000.000 | |||
| Çok formatlı üretken modeller | ||||
| Gemini 3 Pro Görüntü Önizlemesi 🍌 | 5.000 | 5.000.000 | * | 1.000.000.000 |
Bir sonraki katmana yükseltme
Gemini API, tüm faturalandırma hizmetleri için Cloud Faturalandırma'yı kullanır. Ücretsiz katmandan ücretli bir katmana geçmek için önce Google Cloud projenizde Cloud Faturalandırma'yı etkinleştirmeniz gerekir.
Projeniz belirtilen ölçütleri karşıladığında bir sonraki katmana yükseltilmeye uygun hale gelir. Yükseltme isteğinde bulunmak için aşağıdaki adımları uygulayın:
- AI Studio'da API anahtarları sayfasına gidin.
- Yükseltmek istediğiniz projeyi bulun ve "Yükselt"i tıklayın. "Yükselt" seçeneği yalnızca bir sonraki katmanın şartlarını karşılayan projelerde gösterilir.
Hızlı bir doğrulamanın ardından proje bir sonraki katmana yükseltilir.
Oran sınırı artışı isteğinde bulunma
Her model varyasyonunun ilişkili bir sıklık sınırı (dakikada istek sayısı, RPM) vardır. Bu sıklık sınırları hakkında ayrıntılı bilgi için Gemini modelleri başlıklı makaleyi inceleyin.
Ücretli katman için istek oranı sınırı artışı isteğinde bulunma
Hız sınırınızı artıracağımız konusunda garanti veremeyiz ancak isteğinizi incelemek için elimizden geleni yapacağız.