दर की सीमाएं

अनुरोधों की संख्या की सीमाएं, यह तय करती हैं कि किसी तय समयसीमा में Gemini API को कितने अनुरोध किए जा सकते हैं. इन सीमाओं से, सही तरीके से इस्तेमाल करने, गलत इस्तेमाल से बचाने, और सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने में मदद मिलती है.

दर से जुड़ी सीमाएं कैसे काम करती हैं

आम तौर पर, दर की सीमाओं को तीन डाइमेंशन के हिसाब से मेज़र किया जाता है:

  • अनुरोध प्रति मिनट (आरपीएम)
  • हर मिनट में प्रोसेस किए जाने वाले टोकन (इनपुट) (टीपीएम)
  • हर दिन मिलने वाले अनुरोध (RPD)

आपके इस्तेमाल का आकलन हर सीमा के हिसाब से किया जाता है. किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, दर की सीमा से जुड़ी गड़बड़ी ट्रिगर होगी. उदाहरण के लिए, अगर आरपीएम की सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.

अनुरोध की दर से जुड़ी सीमाएं, हर प्रोजेक्ट पर लागू होती हैं, न कि हर एपीआई पासकोड पर.

हर दिन के अनुरोध (आरपीडी) के कोटे, पैसिफ़िक टाइम के मुताबिक आधी रात को रीसेट होते हैं.

इस्तेमाल किए जा रहे मॉडल के हिसाब से सीमाएं अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ खास मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज पर मिनट या IPM की गिनती सिर्फ़ इमेज जनरेट करने वाले मॉडल (Imagen 3) के लिए की जाती है. हालांकि, यह टीपीएम से मिलता-जुलता है. अन्य मॉडल के लिए, हर दिन इस्तेमाल किए जा सकने वाले टोकन की सीमा (टीपीडी) तय की जा सकती है.

एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएं ज़्यादा प्रतिबंधित होती हैं.

इस्तेमाल के टियर

दर से जुड़ी सीमाएं, प्रोजेक्ट के इस्तेमाल के टियर से जुड़ी होती हैं. एपीआई के इस्तेमाल और खर्च में बढ़ोतरी होने पर, आपको ज़्यादा दर की सीमाओं के साथ उच्च स्तर पर अपग्रेड करने का विकल्प मिलेगा.

दूसरे और तीसरे टियर के लिए ज़रूरी शर्तें, Google Cloud सेवाओं (इनमें Gemini API भी शामिल है) पर किए गए कुल खर्च के आधार पर तय की जाती हैं. यह खर्च, आपके प्रोजेक्ट से लिंक किए गए बिलिंग खाते से किया जाता है.

टियर क्वालिफ़िकेशन
मुफ़्त ज़रूरी शर्तें पूरी करने वाले देशों में रहने वाले उपयोगकर्ता
टियर 1 बिलिंग खाता प्रोजेक्ट से लिंक किया गया है
टियर 2 कुल खर्च: > 250 डॉलर और पेमेंट को मंज़ूरी मिले हुए कम से कम 30 दिन हो गए हों
टियर 3 कुल खर्च: > 1,000 डॉलर और पेमेंट को 30 दिन से ज़्यादा हो गए हों

अपग्रेड का अनुरोध करने पर, बुरे बर्ताव से बचाने वाला हमारा ऑटोमेटेड सिस्टम, अतिरिक्त जांच करता है. आम तौर पर, ज़रूरी शर्तें पूरी करने पर ही अपग्रेड करने का अनुरोध स्वीकार कर लिया जाता है. हालांकि, कुछ मामलों में समीक्षा के दौरान मिले अन्य तथ्यों के आधार पर, अपग्रेड करने का अनुरोध अस्वीकार किया जा सकता है.

यह सिस्टम, सभी उपयोगकर्ताओं के लिए Gemini API प्लैटफ़ॉर्म की सुरक्षा और अखंडता बनाए रखने में मदद करता है.

स्टैंडर्ड एपीआई के लिए अनुरोधों की दर से जुड़ी सीमाएं

यहां दी गई टेबल में, Gemini API के सभी स्टैंडर्ड कॉल के लिए दर की सीमाएं दी गई हैं.

फ़्री टियर

मॉडल आरपीएम टीपीएम RPD
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 5 250,000 100
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live 3 सत्र 1,000,000 *
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग 1 सत्र 25,000 5
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 सत्र 10,000 5
Gemini 2.0 Flash Live 3 सत्र 1,000,000 *
मल्टी-मॉडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 3 10,000 15
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक 10 2,00,000 100
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400
Gemini Embedding 100 30,000 1,000
अब इस्तेमाल नहीं किए जा सकने वाले मॉडल
Gemini 1.5 Flash (अब इस्तेमाल नहीं किया जा सकता) 15 250,000 50
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) 15 250,000 50

टियर 1

मॉडल आरपीएम टीपीएम RPD बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 30,00,000
Gemini 2.5 Flash-Lite 4,000 40,00,000 * 10,000,000
Gemini 2.0 Flash 2,000 40,00,000 * 10,000,000
Gemini 2.0 Flash-Lite 4,000 40,00,000 * 10,000,000
Live API
Gemini 2.5 Flash Live 50 सेशन 40,00,000 * *
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग 3 सत्र 50,000 50 *
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 सत्र 25,000 50 *
Gemini 2.0 Flash Live 50 सेशन 40,00,000 * *
मल्टी-मॉडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 10 10,000 100 *
Gemini 2.5 Pro Preview TTS 10 10,000 50 *
Gemini 2.5 Flash की मदद से इमेज जनरेट करने की सुविधा का प्रीव्यू 500 500,000 2,000 *
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक 1,000 1,000,000 10,000 *
Imagen 4 Standard/Fast 10 * 70 *
Imagen 4 Ultra 5 * 30 *
Imagen 3 20 * * *
Veo 3 2 * 10 *
Veo 3 Fast 2 * 10 *
Veo 2 2 * 50 *
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400 *
Gemini Embedding 3,000 1,000,000 * *
अब इस्तेमाल नहीं किए जा सकने वाले मॉडल
Gemini 1.5 Flash (अब इस्तेमाल नहीं किया जा सकता) 2,000 40,00,000 * *
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) 4,000 40,00,000 * *
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जाता) 1,000 40,00,000 * *

टियर 2

मॉडल आरपीएम टीपीएम RPD बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 1,000 5,000,000 50,000 500,000,000
Gemini 2.5 Flash 2,000 30,00,000 1,00,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 * 500,000,000
Gemini 2.0 Flash 10,000 10,000,000 * 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 * 1,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 सत्र 10,000,000 * *
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग 100 सेशन 1,000,000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 सत्र 25,000 50 *
Gemini 2.0 Flash Live 1,000 सत्र 10,000,000 * *
मल्टी-मॉडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 1,000 1,00,000 10,000 *
Gemini 2.5 Pro Preview TTS 100 25,000 1,000 *
Gemini 2.5 Flash की मदद से इमेज जनरेट करने की सुविधा का प्रीव्यू 2,000 1,500,000 50,000 *
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक 2,000 30,00,000 1,00,000 *
Imagen 4 Standard/Fast 15 * 1000 *
Imagen 4 Ultra 10 * 400 *
Imagen 3 20 * * *
Veo 3 4 * 50 *
Veo 3 Fast 4 * 50 *
Veo 2 2 * 50 *
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400 *
Gemini Embedding 5,000 5,000,000 * *
अब इस्तेमाल नहीं किए जा सकने वाले मॉडल
Gemini 1.5 Flash (अब इस्तेमाल नहीं किया जा सकता) 2,000 40,00,000 * *
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) 4,000 40,00,000 * *
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जाता) 1,000 40,00,000 * *

टियर 3

मॉडल आरपीएम टीपीएम RPD बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 2,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 3,00,00,000 * 1,000,000,000
Gemini 2.0 Flash 30,000 3,00,00,000 * 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 3,00,00,000 * 5,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 सत्र 10,000,000 * *
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग 100 सेशन 1,000,000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 सत्र 25,000 50 *
Gemini 2.0 Flash Live 1,000 सत्र 10,000,000 * *
मल्टी-मॉडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 1,000 1,000,000 * *
Gemini 2.5 Pro Preview TTS 100 1,000,000 * *
Gemini 2.5 Flash की मदद से इमेज जनरेट करने की सुविधा का प्रीव्यू 5,000 5,000,000 * *
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक 5,000 5,000,000 * *
Imagen 4 Standard/Fast 20 * 15,000 *
Imagen 4 Ultra 15 * 5,000 *
Imagen 3 20 * * *
Veo 3 10 * 500 *
Veo 3 Fast 10 * 500 *
Veo 2 2 * 50 *
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400 *
Gemini Embedding 10,000 10,000,000 * *
अब इस्तेमाल नहीं किए जा सकने वाले मॉडल
Gemini 1.5 Flash (अब इस्तेमाल नहीं किया जा सकता) 2,000 40,00,000 * *
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) 4,000 40,00,000 * *
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जाता) 1,000 40,00,000 * *

तय की गई दर की सीमाओं की गारंटी नहीं दी जाती. साथ ही, असल क्षमता अलग-अलग हो सकती है.

बैच मोड के लिए रेट लिमिट

बैच मोड के अनुरोधों पर, दर से जुड़ी अपनी सीमाएं लागू होती हैं. ये सीमाएं, नॉन-बैच मोड वाले एपीआई कॉल से अलग होती हैं.

  • एक साथ किए गए बैच अनुरोध: 100
  • इनपुट फ़ाइल का साइज़: 2 जीबी
  • फ़ाइल स्टोरेज की सीमा: 20 जीबी
  • हर मॉडल के लिए, लाइन में लगे टोकन: दर की सीमाओं वाली टेबल में मौजूद बैच में लाइन में लगे टोकन कॉलम में, किसी मॉडल के लिए बैच प्रोसेसिंग के लिए लाइन में लगाए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या दी गई होती है. यह संख्या, आपके सभी चालू बैच जॉब के लिए होती है. एपीआई के लिए अनुरोध करने की स्टैंडर्ड सीमाओं वाली टेबल में देखें.

अगले टियर पर अपग्रेड करने का तरीका

Gemini API, बिलिंग से जुड़ी सभी सेवाओं के लिए Cloud Billing का इस्तेमाल करता है. मुफ़्त टियर से पैसे चुकाकर लिए जाने वाले टियर पर स्विच करने के लिए, आपको सबसे पहले अपने Google Cloud प्रोजेक्ट के लिए Cloud Billing की सुविधा चालू करनी होगी.

जब आपका प्रोजेक्ट तय की गई शर्तों को पूरा कर लेता है, तब उसे अगले टियर में अपग्रेड किया जा सकता है. अपग्रेड का अनुरोध करने के लिए, यह तरीका अपनाएं:

पुष्टि हो जाने के बाद, प्रोजेक्ट को अगले टियर में अपग्रेड कर दिया जाएगा.

अनुरोधों की संख्या बढ़ाने का अनुरोध करना

हर मॉडल वेरिएशन के लिए, दर की सीमा (हर मिनट में किए जाने वाले अनुरोध, आरपीएम) तय की जाती है. इन सीमाओं के बारे में जानने के लिए, Gemini मॉडल देखें.

पैसे चुकाकर लिए जाने वाले टियर के लिए, अनुरोधों की संख्या बढ़ाने का अनुरोध करना

हम दर की सीमा बढ़ाने की कोई गारंटी नहीं देते, लेकिन हम आपके अनुरोध की समीक्षा करने की पूरी कोशिश करेंगे.