दर की सीमाएं

अनुरोधों की संख्या की सीमाएं, यह तय करती हैं कि किसी तय समयसीमा में Gemini API को कितने अनुरोध किए जा सकते हैं. इन सीमाओं से, सही तरीके से इस्तेमाल करने, गलत इस्तेमाल से बचाने, और सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने में मदद मिलती है.

दर की सीमाएं कैसे काम करती हैं

आम तौर पर, दर की सीमाओं को तीन डाइमेंशन के हिसाब से मेज़र किया जाता है:

  • अनुरोध प्रति मिनट (आरपीएम)
  • इनपुट किए गए टोकन प्रति मिनट (टीपीएम)
  • हर दिन मिलने वाले अनुरोध (RPD)

आपके इस्तेमाल का आकलन हर सीमा के हिसाब से किया जाता है. इनमें से किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, दर की सीमा से जुड़ी गड़बड़ी ट्रिगर होगी. उदाहरण के लिए, अगर आरपीएम की सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.

अनुरोध की दर से जुड़ी सीमाएं, हर प्रोजेक्ट पर लागू होती हैं, न कि हर एपीआई पासकोड पर.

हर दिन के अनुरोध (RPD) के कोटे, पैसिफ़िक टाइम के मुताबिक आधी रात को रीसेट होते हैं.

इस्तेमाल किए जा रहे मॉडल के हिसाब से सीमाएं अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ खास मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज पर मिनट या IPM की गिनती सिर्फ़ इमेज जनरेट करने वाले मॉडल (Imagen 3) के लिए की जाती है. हालांकि, यह टीपीएम से मिलता-जुलता है. अन्य मॉडल के लिए, हर दिन इस्तेमाल किए जा सकने वाले टोकन की सीमा (टीपीडी) तय की जा सकती है.

एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएं ज़्यादा प्रतिबंधित होती हैं.

इस्तेमाल के टियर

दर से जुड़ी सीमाएं, प्रोजेक्ट के इस्तेमाल के टियर से जुड़ी होती हैं. एपीआई के इस्तेमाल और खर्च में बढ़ोतरी होने पर, आपके पास ज़्यादा दर की सीमाओं के साथ, सदस्यता के ऊंचे लेवल पर अपग्रेड करने का विकल्प होगा.

दूसरे और तीसरे टियर के लिए ज़रूरी शर्तें, Google Cloud सेवाओं (इनमें Gemini API भी शामिल है) पर किए गए कुल खर्च के आधार पर तय की जाती हैं. यह खर्च, आपके प्रोजेक्ट से लिंक किए गए बिलिंग खाते से किया जाता है.

टियर क्वालिफ़िकेशन
मुफ़्त ज़रूरी शर्तें पूरी करने वाले देशों में रहने वाले उपयोगकर्ता
टियर 1 बिलिंग खाता प्रोजेक्ट से लिंक किया गया है
टियर 2 कुल खर्च: 250 डॉलर से ज़्यादा और पेमेंट को मंज़ूरी मिले हुए कम से कम 30 दिन हो गए हों
टियर 3 कुल खर्च: > 1,000 डॉलर और पेमेंट को 30 दिन से ज़्यादा हो गए हों

अपग्रेड का अनुरोध करने पर, बुरे बर्ताव से बचाने वाला हमारा ऑटोमेटेड सिस्टम, अतिरिक्त जांच करता है. आम तौर पर, ज़रूरी शर्तें पूरी करने पर ही अपग्रेड करने का अनुरोध स्वीकार कर लिया जाता है. हालांकि, कुछ मामलों में समीक्षा के दौरान मिले अन्य तथ्यों के आधार पर, अपग्रेड करने का अनुरोध अस्वीकार किया जा सकता है.

यह सिस्टम, सभी उपयोगकर्ताओं के लिए Gemini API प्लैटफ़ॉर्म की सुरक्षा और अखंडता बनाए रखने में मदद करता है.

स्टैंडर्ड एपीआई के लिए अनुरोधों की दर की सीमाएं

यहां दी गई टेबल में, Gemini API के सभी स्टैंडर्ड कॉल के लिए दर की सीमाएं दी गई हैं.

फ़्री टियर

मॉडल आरपीएम टीपीएम RPD
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 5 250,000 100
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live 3 सत्र 1,000,000 *
Gemini 2.5 Flash Preview Native Audio Dialog 1 सत्र 25,000 5
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 सत्र 10,000 5
Gemini 2.0 Flash Live 3 सत्र 1,000,000 *
मल्टी-मॉडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 3 10,000 15
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक 10 2,00,000 100
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400
Gemini Embedding 100 30,000 1,000
अब काम नहीं करने वाले मॉडल
Gemini 1.5 Flash (अब इस्तेमाल नहीं किया जा सकता) 15 250,000 50
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) 15 250,000 50

टियर 1

मॉडल आरपीएम टीपीएम RPD बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 30,00,000
Gemini 2.5 Flash-Lite 4,000 40,00,000 * 10,000,000
Gemini 2.0 Flash 2,000 40,00,000 * 10,000,000
Gemini 2.0 Flash-Lite 4,000 40,00,000 * 10,000,000
Live API
Gemini 2.5 Flash Live 50 सेशन 40,00,000 * *
Gemini 2.5 Flash Preview Native Audio Dialog 3 सत्र 50,000 50 *
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 सत्र 25,000 50 *
Gemini 2.0 Flash Live 50 सेशन 40,00,000 * *
मल्टी-मॉडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 10 10,000 100 *
Gemini 2.5 Pro Preview TTS 10 10,000 50 *
Gemini 2.5 Flash की इमेज प्रीव्यू करने की सुविधा 500 500,000 2,000 *
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक 1,000 1,000,000 10,000 *
Imagen 4 Standard/Fast 10 * 70 *
Imagen 4 Ultra 5 * 30 *
Imagen 3 20 * * *
Veo 3 2 * 10 *
Veo 3 Fast 2 * 10 *
Veo 2 2 * 50 *
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400 *
Gemini Embedding 3,000 1,000,000 * *
अब काम नहीं करने वाले मॉडल
Gemini 1.5 Flash (अब इस्तेमाल नहीं किया जा सकता) 2,000 40,00,000 * *
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) 4,000 40,00,000 * *
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जा सकता) 1,000 40,00,000 * *

टियर 2

मॉडल आरपीएम टीपीएम RPD बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 1,000 5,000,000 50,000 500,000,000
Gemini 2.5 Flash 2,000 30,00,000 1,00,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 * 500,000,000
Gemini 2.0 Flash 10,000 10,000,000 * 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 * 1,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 सत्र 10,000,000 * *
Gemini 2.5 Flash Preview Native Audio Dialog 100 सेशन 1,000,000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 सत्र 25,000 50 *
Gemini 2.0 Flash Live 1,000 सत्र 10,000,000 * *
मल्टी-मॉडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 1,000 1,00,000 10,000 *
Gemini 2.5 Pro Preview TTS 100 25,000 1,000 *
Gemini 2.5 Flash की इमेज प्रीव्यू करने की सुविधा 2,000 1,500,000 50,000 *
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक 2,000 30,00,000 1,00,000 *
Imagen 4 Standard/Fast 15 * 1000 *
Imagen 4 Ultra 10 * 400 *
Imagen 3 20 * * *
Veo 3 4 * 50 *
Veo 3 Fast 4 * 50 *
Veo 2 2 * 50 *
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400 *
Gemini Embedding 5,000 5,000,000 * *
अब काम नहीं करने वाले मॉडल
Gemini 1.5 Flash (अब इस्तेमाल नहीं किया जा सकता) 2,000 40,00,000 * *
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) 4,000 40,00,000 * *
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जा सकता) 1,000 40,00,000 * *

टियर 3

मॉडल आरपीएम टीपीएम RPD बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 2,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 3,00,00,000 * 1,000,000,000
Gemini 2.0 Flash 30,000 3,00,00,000 * 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 3,00,00,000 * 5,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 सत्र 10,000,000 * *
Gemini 2.5 Flash Preview Native Audio Dialog 100 सेशन 1,000,000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 सत्र 25,000 50 *
Gemini 2.0 Flash Live 1,000 सत्र 10,000,000 * *
मल्टी-मॉडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 1,000 1,000,000 * *
Gemini 2.5 Pro Preview TTS 100 1,000,000 * *
Gemini 2.5 Flash की इमेज प्रीव्यू करने की सुविधा 5,000 5,000,000 * *
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक 5,000 5,000,000 * *
Imagen 4 Standard/Fast 20 * 15,000 *
Imagen 4 Ultra 15 * 5,000 *
Imagen 3 20 * * *
Veo 3 10 * 500 *
Veo 3 Fast 10 * 500 *
Veo 2 2 * 50 *
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400 *
Gemini Embedding 10,000 10,000,000 * *
अब काम नहीं करने वाले मॉडल
Gemini 1.5 Flash (अब इस्तेमाल नहीं किया जा सकता) 2,000 40,00,000 * *
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) 4,000 40,00,000 * *
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जा सकता) 1,000 40,00,000 * *

तय की गई दर की सीमाओं की गारंटी नहीं दी जाती. साथ ही, असल क्षमता अलग-अलग हो सकती है.

बैच एपीआई के लिए रेट लिमिट

Batch API के अनुरोधों पर, दर की अपनी सीमाएं लागू होती हैं. ये सीमाएं, नॉन-बैच एपीआई कॉल से अलग होती हैं.

  • एक साथ किए जाने वाले बैच अनुरोध: 100
  • इनपुट फ़ाइल का साइज़: 2 जीबी
  • फ़ाइल स्टोरेज की सीमा: 20 जीबी
  • हर मॉडल के लिए, लाइन में लगे टोकन: दर की सीमाओं वाली टेबल के बैच में लाइन में लगे टोकन कॉलम में, किसी मॉडल के लिए बैच प्रोसेसिंग के लिए लाइन में लगाए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या दी गई होती है. यह संख्या, आपके सभी चालू बैच जॉब के लिए होती है. एपीआई के लिए अनुरोध करने की स्टैंडर्ड सीमाओं वाली टेबल में देखें.

अगले टियर पर अपग्रेड करने का तरीका

Gemini API, बिलिंग से जुड़ी सभी सेवाओं के लिए Cloud Billing का इस्तेमाल करता है. मुफ़्त टियर से पैसे चुकाकर लिए जाने वाले टियर पर स्विच करने के लिए, आपको सबसे पहले अपने Google Cloud प्रोजेक्ट के लिए Cloud Billing की सुविधा चालू करनी होगी.

जब आपका प्रोजेक्ट तय की गई शर्तों को पूरा कर लेता है, तब उसे अगले टियर में अपग्रेड किया जा सकता है. अपग्रेड करने का अनुरोध करने के लिए, यह तरीका अपनाएं:

पुष्टि हो जाने के बाद, प्रोजेक्ट को अगले टियर में अपग्रेड कर दिया जाएगा.

अनुरोधों की संख्या बढ़ाने का अनुरोध करना

हर मॉडल वेरिएशन के लिए, अनुरोधों की संख्या की सीमा (हर मिनट में किए जाने वाले अनुरोध, आरपीएम) तय की गई है. इन सीमाओं के बारे में जानने के लिए, Gemini मॉडल देखें.

पैसे चुकाकर ली जाने वाली सदस्यता के लिए, अनुरोधों की संख्या बढ़ाने का अनुरोध करना

हम दर की सीमा बढ़ाने की कोई गारंटी नहीं देते, लेकिन हम आपके अनुरोध की समीक्षा करने की पूरी कोशिश करेंगे.