दर की सीमाएं

अनुरोधों की संख्या सीमित करने से, यह तय होता है कि किसी तय समयसीमा में Gemini API को कितने अनुरोध किए जा सकते हैं. इन सीमाओं से, सही तरीके से इस्तेमाल करने, गलत इस्तेमाल से बचाने, और सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने में मदद मिलती है.

AI Studio में, दर से जुड़ी लागू सीमाएं देखना

अनुरोध करने की सीमाएं कैसे काम करती हैं

आम तौर पर, दर की सीमाओं को तीन डाइमेंशन के हिसाब से मेज़र किया जाता है:

  • हर मिनट में किए गए अनुरोधों की संख्या (आरपीएम)
  • हर मिनट इस्तेमाल किए जाने वाले टोकन (इनपुट) (टीपीएम)
  • हर दिन के हिसाब से अनुरोध (RPD)

आपके इस्तेमाल का आकलन हर सीमा के हिसाब से किया जाता है. किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, दर की सीमा से जुड़ी गड़बड़ी ट्रिगर होगी. उदाहरण के लिए, अगर आरपीएम की सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.

दर सीमाएं, हर प्रोजेक्ट पर लागू होती हैं, न कि हर एपीआई कुंजी पर.

हर दिन के अनुरोध (RPD) का कोटा, पैसिफ़िक टाइम के मुताबिक आधी रात को रीसेट होता है.

इस्तेमाल की सीमाएं, इस्तेमाल किए जा रहे मॉडल के हिसाब से अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ खास मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज पर मिनट (आईपीएम) की गिनती सिर्फ़ इमेज जनरेट करने वाले मॉडल (Imagen 3) के लिए की जाती है. हालांकि, यह टीपीएम की तरह ही काम करता है. अन्य मॉडल के लिए, हर दिन इस्तेमाल किए जा सकने वाले टोकन की सीमा (टीपीडी) तय की जा सकती है.

एक्सपेरिमेंट के तौर पर उपलब्ध और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएं ज़्यादा प्रतिबंधित होती हैं.

इस्तेमाल के टियर

दर से जुड़ी सीमाएं, प्रोजेक्ट के इस्तेमाल के टियर से जुड़ी होती हैं. एपीआई के इस्तेमाल और खर्च में बढ़ोतरी होने पर, आपके पास ज़्यादा दर की सीमाओं के साथ उच्च स्तर पर अपग्रेड करने का विकल्प होगा.

दूसरे और तीसरे टियर के लिए ज़रूरी शर्तें, Google Cloud सेवाओं (इनमें Gemini API भी शामिल है) पर किए गए कुल खर्च के आधार पर तय की जाती हैं. यह खर्च, आपके प्रोजेक्ट से लिंक किए गए बिलिंग खाते से किया जाता है.

टियर क्वालिफ़िकेशन
मुफ़्त ज़रूरी शर्तें पूरी करने वाले देशों में रहने वाले उपयोगकर्ता
टियर 1 बिलिंग खाता प्रोजेक्ट से लिंक किया गया है
टियर 2 कुल खर्च: > 250 डॉलर और पेमेंट को मंज़ूरी मिले हुए कम से कम 30 दिन हो गए हों
टियर 3 कुल खर्च: > 1,000 डॉलर और पेमेंट को मंज़ूरी मिले हुए कम से कम 30 दिन हो गए हों

अपग्रेड का अनुरोध करने पर, बुरे बर्ताव से बचाने वाला हमारा ऑटोमेटेड सिस्टम, कुछ और जांचें करता है. ज़रूरी शर्तें पूरी करने पर, आम तौर पर अपग्रेड करने का अनुरोध स्वीकार कर लिया जाता है. हालांकि, कुछ मामलों में समीक्षा के दौरान मिले अन्य तथ्यों के आधार पर, अपग्रेड करने का अनुरोध अस्वीकार किया जा सकता है.

यह सिस्टम, सभी उपयोगकर्ताओं के लिए Gemini API प्लैटफ़ॉर्म की सुरक्षा और अखंडता बनाए रखने में मदद करता है.

स्टैंडर्ड एपीआई के लिए अनुरोधों की दर से जुड़ी सीमाएं

यहां दी गई टेबल में, Gemini API के सभी स्टैंडर्ड कॉल के लिए तय की गई दर की सीमाएं दी गई हैं.

फ़्री टियर

मॉडल आरपीएम टीपीएम RPD
टेक्स्ट-आउट मॉडल
Gemini 2.5 Pro 2 1,25,000 50
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash की झलक 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini 2.5 Flash-Lite की झलक 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live * 1,000,000 *
Gemini 2.5 Flash Preview Native Audio * 500,000 *
Gemini 2.0 Flash Live * 1,000,000 *
मल्टी-मोडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 3 10,000 15
Gemini 2.0 Flash की झलक देखने के लिए, इमेज जनरेट करने की सुविधा 10 2,00,000 100
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400
Gemini Embedding 100 30,000 1,000
Gemini Robotics-ER 1.5 की झलक 10 250,000 250
इस्तेमाल नहीं किए जा सकने वाले मॉडल
Gemini 1.5 Flash (अब उपलब्ध नहीं है) 15 250,000 50
Gemini 1.5 Flash-8B (अब इस्तेमाल नहीं किया जाता) 15 250,000 50

टियर 1

मॉडल आरपीएम टीपीएम RPD बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 3 Pro की झलक 50 1,000,000 1,000 5,00,00,000
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 30,00,000
Gemini 2.5 Flash की झलक 1,000 1,000,000 10,000 30,00,000
Gemini 2.5 Flash-Lite 4,000 40,00,000 * 10,000,000
Gemini 2.5 Flash-Lite की झलक 4,000 40,00,000 * 10,000,000
Gemini 2.0 Flash 2,000 40,00,000 * 10,000,000
Gemini 2.0 Flash-Lite 4,000 40,00,000 * 10,000,000
Live API
Gemini 2.5 Flash Live 50 सेशन 40,00,000 * *
Gemini 2.5 Flash Preview Native Audio * 1,000,000 * *
Gemini 2.0 Flash Live 50 सेशन 40,00,000 * *
मल्टी-मोडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 10 10,000 100 *
Gemini 2.5 Pro Preview TTS 10 10,000 50 *
Gemini 2.5 Flash की इमेज 🍌 500 500,000 2,000 *
Gemini 2.0 Flash की झलक देखने के लिए, इमेज जनरेट करने की सुविधा 1,000 1,000,000 10,000 *
Imagen 4 Standard/Fast 10 * 70 *
Imagen 4 Ultra 5 * 30 *
Imagen 3 20 * * *
Veo 3.1 2 * 10 *
Veo 3.1 Fast 2 * 10 *
Veo 3 2 * 10 *
Veo 3 Fast 2 * 10 *
Veo 2 2 * 50 *
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400 *
Gemini Embedding 3,000 1,000,000 * *
Gemini Robotics-ER 1.5 की झलक 300 1,000,000 10,000 *
Gemini 2.5 Computer Use Preview 150 2,000,000 10,000 *
इस्तेमाल नहीं किए जा सकने वाले मॉडल
Gemini 1.5 Flash (अब उपलब्ध नहीं है) 2,000 40,00,000 * *
Gemini 1.5 Flash-8B (अब इस्तेमाल नहीं किया जाता) 4,000 40,00,000 * *
Gemini 1.5 Pro (अब उपलब्ध नहीं है) 1,000 40,00,000 * *

टियर 2

मॉडल आरपीएम टीपीएम RPD बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 3 Pro की झलक 1,000 5,000,000 50,000 500,000,000
Gemini 2.5 Pro 1,000 5,000,000 50,000 500,000,000
Gemini 2.5 Flash 2,000 30,00,000 1,00,000 400,000,000
Gemini 2.5 Flash की झलक 2,000 30,00,000 1,00,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 * 500,000,000
Gemini 2.5 Flash-Lite की झलक 10,000 10,000,000 * 500,000,000
Gemini 2.0 Flash 10,000 10,000,000 * 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 * 1,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 सत्र 10,000,000 * *
Gemini 2.5 Flash Preview Native Audio * 10,000,000 * *
Gemini 2.0 Flash Live 1,000 सत्र 10,000,000 * *
मल्टी-मोडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 1,000 1,00,000 10,000 *
Gemini 2.5 Pro Preview TTS 100 25,000 1,000 *
Gemini 2.5 Flash की इमेज 🍌 2,000 1,500,000 50,000 *
Gemini 2.0 Flash की झलक देखने के लिए, इमेज जनरेट करने की सुविधा 2,000 30,00,000 1,00,000 *
Imagen 4 Standard/Fast 15 * 1000 *
Imagen 4 Ultra 10 * 400 *
Imagen 3 20 * * *
Veo 3.1 4 * 50 *
Veo 3.1 Fast 4 * 50 *
Veo 3 4 * 50 *
Veo 3 Fast 4 * 50 *
Veo 2 2 * 50 *
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400 *
Gemini Embedding 5,000 5,000,000 * *
Gemini Robotics-ER 1.5 की झलक 400 30,00,000 1,00,000 *
Gemini 2.5 Computer Use Preview 1,000 5,000,000 50,000 *
इस्तेमाल नहीं किए जा सकने वाले मॉडल
Gemini 1.5 Flash (अब उपलब्ध नहीं है) 2,000 40,00,000 * *
Gemini 1.5 Flash-8B (अब इस्तेमाल नहीं किया जाता) 4,000 40,00,000 * *
Gemini 1.5 Pro (अब उपलब्ध नहीं है) 1,000 40,00,000 * *

टियर 3

मॉडल आरपीएम टीपीएम RPD बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 3 Pro की झलक 2,000 8,000,000 * 1,000,000,000
Gemini 2.5 Pro 2,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash की झलक 10,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 3,00,00,000 * 1,000,000,000
Gemini 2.5 Flash-Lite की झलक 30,000 3,00,00,000 * 1,000,000,000
Gemini 2.0 Flash 30,000 3,00,00,000 * 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 3,00,00,000 * 5,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 सत्र 10,000,000 * *
Gemini 2.5 Flash Preview Native Audio * 10,000,000 * *
Gemini 2.0 Flash Live 1,000 सत्र 10,000,000 * *
मल्टी-मोडल जनरेशन मॉडल
Gemini 2.5 Flash Preview TTS 1,000 1,000,000 * *
Gemini 2.5 Pro Preview TTS 100 1,000,000 * *
Gemini 2.5 Flash की इमेज 🍌 5,000 5,000,000 * *
Gemini 2.0 Flash की झलक देखने के लिए, इमेज जनरेट करने की सुविधा 5,000 5,000,000 * *
Imagen 4 Standard/Fast 20 * 15,000 *
Imagen 4 Ultra 15 * 5,000 *
Imagen 3 20 * * *
Veo 3.1 10 * 500 *
Veo 3.1 Fast 10 * 500 *
Veo 3 10 * 500 *
Veo 3 Fast 10 * 500 *
Veo 2 2 * 50 *
अन्य मॉडल
Gemma 3 और 3n 30 15,000 14,400 *
Gemini Embedding 10,000 10,000,000 * *
Gemini Robotics-ER 1.5 की झलक 600 8,000,000 * *1,000,000,000*
Gemini 2.5 Computer Use Preview 2,000 8,000,000 * *
इस्तेमाल नहीं किए जा सकने वाले मॉडल
Gemini 1.5 Flash (अब उपलब्ध नहीं है) 2,000 40,00,000 * *
Gemini 1.5 Flash-8B (अब इस्तेमाल नहीं किया जाता) 4,000 40,00,000 * *
Gemini 1.5 Pro (अब उपलब्ध नहीं है) 1,000 40,00,000 * *

तय की गई दर की सीमाओं की गारंटी नहीं दी जाती. साथ ही, असल क्षमता अलग-अलग हो सकती है.

बैच एपीआई के लिए रेट लिमिट

Batch API अनुरोधों के लिए, दर की सीमाएं अलग से तय की जाती हैं. ये सीमाएं, नॉन-बैच एपीआई कॉल से अलग होती हैं.

  • एक साथ किए जाने वाले बैच अनुरोध: 100
  • इनपुट फ़ाइल का साइज़: 2 जीबी
  • फ़ाइल स्टोरेज की सीमा: 20 जीबी
  • हर मॉडल के लिए, लाइन में लगे टोकन: दर सीमा की टेबल में मौजूद बैच में लाइन में लगे टोकन कॉलम में, किसी मॉडल के लिए बैच प्रोसेसिंग के लिए लाइन में लगाए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या दी गई होती है. यह संख्या, आपके सभी चालू बैच जॉब के लिए होती है. एपीआई के लिए अनुरोध करने की स्टैंडर्ड सीमाओं वाली टेबल में देखें.

अगले टियर पर अपग्रेड करने का तरीका

Gemini API, बिलिंग से जुड़ी सभी सेवाओं के लिए Cloud Billing का इस्तेमाल करता है. मुफ़्त टियर से पैसे चुकाकर लिए जाने वाले टियर पर स्विच करने के लिए, आपको सबसे पहले अपने Google Cloud प्रोजेक्ट के लिए Cloud Billing की सुविधा चालू करनी होगी.

जब आपका प्रोजेक्ट तय की गई शर्तों को पूरा कर लेता है, तब उसे अगले टियर में अपग्रेड किया जा सकता है. अपग्रेड का अनुरोध करने के लिए, यह तरीका अपनाएं:

पुष्टि हो जाने के बाद, प्रोजेक्ट को अगले टियर में अपग्रेड कर दिया जाएगा.

अनुरोधों की संख्या बढ़ाने का अनुरोध करना

हर मॉडल वेरिएशन के लिए, दर की सीमा (हर मिनट में किए जाने वाले अनुरोध, आरपीएम) तय की जाती है. इन दर की सीमाओं के बारे में जानने के लिए, Gemini मॉडल देखें.

पैसे चुकाकर लिए जाने वाले टियर के लिए, अनुरोधों की संख्या बढ़ाने का अनुरोध करना

हम दर की सीमा बढ़ाने की कोई गारंटी नहीं देते, लेकिन हम आपके अनुरोध की समीक्षा करने की पूरी कोशिश करेंगे.