अनुरोधों की संख्या की सीमाएं, यह तय करती हैं कि किसी तय समयसीमा में Gemini API को कितने अनुरोध किए जा सकते हैं. इन सीमाओं से, सही तरीके से इस्तेमाल करने, गलत इस्तेमाल से बचाने, और सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने में मदद मिलती है.
दर की सीमाएं कैसे काम करती हैं
आम तौर पर, दर की सीमाओं को तीन डाइमेंशन के हिसाब से मेज़र किया जाता है:
- अनुरोध प्रति मिनट (आरपीएम)
- इनपुट किए गए टोकन प्रति मिनट (टीपीएम)
- हर दिन मिलने वाले अनुरोध (RPD)
आपके इस्तेमाल का आकलन हर सीमा के हिसाब से किया जाता है. इनमें से किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, दर की सीमा से जुड़ी गड़बड़ी ट्रिगर होगी. उदाहरण के लिए, अगर आरपीएम की सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.
अनुरोध की दर से जुड़ी सीमाएं, हर प्रोजेक्ट पर लागू होती हैं, न कि हर एपीआई पासकोड पर.
हर दिन के अनुरोध (RPD) के कोटे, पैसिफ़िक टाइम के मुताबिक आधी रात को रीसेट होते हैं.
इस्तेमाल किए जा रहे मॉडल के हिसाब से सीमाएं अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ खास मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज पर मिनट या IPM की गिनती सिर्फ़ इमेज जनरेट करने वाले मॉडल (Imagen 3) के लिए की जाती है. हालांकि, यह टीपीएम से मिलता-जुलता है. अन्य मॉडल के लिए, हर दिन इस्तेमाल किए जा सकने वाले टोकन की सीमा (टीपीडी) तय की जा सकती है.
एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएं ज़्यादा प्रतिबंधित होती हैं.
इस्तेमाल के टियर
दर से जुड़ी सीमाएं, प्रोजेक्ट के इस्तेमाल के टियर से जुड़ी होती हैं. एपीआई के इस्तेमाल और खर्च में बढ़ोतरी होने पर, आपके पास ज़्यादा दर की सीमाओं के साथ, सदस्यता के ऊंचे लेवल पर अपग्रेड करने का विकल्प होगा.
दूसरे और तीसरे टियर के लिए ज़रूरी शर्तें, Google Cloud सेवाओं (इनमें Gemini API भी शामिल है) पर किए गए कुल खर्च के आधार पर तय की जाती हैं. यह खर्च, आपके प्रोजेक्ट से लिंक किए गए बिलिंग खाते से किया जाता है.
टियर | क्वालिफ़िकेशन |
---|---|
मुफ़्त | ज़रूरी शर्तें पूरी करने वाले देशों में रहने वाले उपयोगकर्ता |
टियर 1 | बिलिंग खाता प्रोजेक्ट से लिंक किया गया है |
टियर 2 | कुल खर्च: 250 डॉलर से ज़्यादा और पेमेंट को मंज़ूरी मिले हुए कम से कम 30 दिन हो गए हों |
टियर 3 | कुल खर्च: > 1,000 डॉलर और पेमेंट को 30 दिन से ज़्यादा हो गए हों |
अपग्रेड का अनुरोध करने पर, बुरे बर्ताव से बचाने वाला हमारा ऑटोमेटेड सिस्टम, अतिरिक्त जांच करता है. आम तौर पर, ज़रूरी शर्तें पूरी करने पर ही अपग्रेड करने का अनुरोध स्वीकार कर लिया जाता है. हालांकि, कुछ मामलों में समीक्षा के दौरान मिले अन्य तथ्यों के आधार पर, अपग्रेड करने का अनुरोध अस्वीकार किया जा सकता है.
यह सिस्टम, सभी उपयोगकर्ताओं के लिए Gemini API प्लैटफ़ॉर्म की सुरक्षा और अखंडता बनाए रखने में मदद करता है.
स्टैंडर्ड एपीआई के लिए अनुरोधों की दर की सीमाएं
यहां दी गई टेबल में, Gemini API के सभी स्टैंडर्ड कॉल के लिए दर की सीमाएं दी गई हैं.
फ़्री टियर
मॉडल | आरपीएम | टीपीएम | RPD |
---|---|---|---|
टेक्स्ट-आउट मॉडल | |||
Gemini 2.5 Pro | 5 | 250,000 | 100 |
Gemini 2.5 Flash | 10 | 250,000 | 250 |
Gemini 2.5 Flash-Lite | 15 | 250,000 | 1,000 |
Gemini 2.0 Flash | 15 | 1,000,000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
Live API | |||
Gemini 2.5 Flash Live | 3 सत्र | 1,000,000 | * |
Gemini 2.5 Flash Preview Native Audio Dialog | 1 सत्र | 25,000 | 5 |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 सत्र | 10,000 | 5 |
Gemini 2.0 Flash Live | 3 सत्र | 1,000,000 | * |
मल्टी-मॉडल जनरेशन मॉडल | |||
Gemini 2.5 Flash Preview TTS | 3 | 10,000 | 15 |
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक | 10 | 2,00,000 | 100 |
अन्य मॉडल | |||
Gemma 3 और 3n | 30 | 15,000 | 14,400 |
Gemini Embedding | 100 | 30,000 | 1,000 |
अब काम नहीं करने वाले मॉडल | |||
Gemini 1.5 Flash (अब इस्तेमाल नहीं किया जा सकता) | 15 | 250,000 | 50 |
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) | 15 | 250,000 | 50 |
टियर 1
मॉडल | आरपीएम | टीपीएम | RPD | बैच में शामिल किए गए टोकन |
---|---|---|---|---|
टेक्स्ट-आउट मॉडल | ||||
Gemini 2.5 Pro | 150 | 2,000,000 | 10,000 | 5,000,000 |
Gemini 2.5 Flash | 1,000 | 1,000,000 | 10,000 | 30,00,000 |
Gemini 2.5 Flash-Lite | 4,000 | 40,00,000 | * | 10,000,000 |
Gemini 2.0 Flash | 2,000 | 40,00,000 | * | 10,000,000 |
Gemini 2.0 Flash-Lite | 4,000 | 40,00,000 | * | 10,000,000 |
Live API | ||||
Gemini 2.5 Flash Live | 50 सेशन | 40,00,000 | * | * |
Gemini 2.5 Flash Preview Native Audio Dialog | 3 सत्र | 50,000 | 50 | * |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 सत्र | 25,000 | 50 | * |
Gemini 2.0 Flash Live | 50 सेशन | 40,00,000 | * | * |
मल्टी-मॉडल जनरेशन मॉडल | ||||
Gemini 2.5 Flash Preview TTS | 10 | 10,000 | 100 | * |
Gemini 2.5 Pro Preview TTS | 10 | 10,000 | 50 | * |
Gemini 2.5 Flash की इमेज प्रीव्यू करने की सुविधा | 500 | 500,000 | 2,000 | * |
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक | 1,000 | 1,000,000 | 10,000 | * |
Imagen 4 Standard/Fast | 10 | * | 70 | * |
Imagen 4 Ultra | 5 | * | 30 | * |
Imagen 3 | 20 | * | * | * |
Veo 3 | 2 | * | 10 | * |
Veo 3 Fast | 2 | * | 10 | * |
Veo 2 | 2 | * | 50 | * |
अन्य मॉडल | ||||
Gemma 3 और 3n | 30 | 15,000 | 14,400 | * |
Gemini Embedding | 3,000 | 1,000,000 | * | * |
अब काम नहीं करने वाले मॉडल | ||||
Gemini 1.5 Flash (अब इस्तेमाल नहीं किया जा सकता) | 2,000 | 40,00,000 | * | * |
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) | 4,000 | 40,00,000 | * | * |
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जा सकता) | 1,000 | 40,00,000 | * | * |
टियर 2
मॉडल | आरपीएम | टीपीएम | RPD | बैच में शामिल किए गए टोकन |
---|---|---|---|---|
टेक्स्ट-आउट मॉडल | ||||
Gemini 2.5 Pro | 1,000 | 5,000,000 | 50,000 | 500,000,000 |
Gemini 2.5 Flash | 2,000 | 30,00,000 | 1,00,000 | 400,000,000 |
Gemini 2.5 Flash-Lite | 10,000 | 10,000,000 | * | 500,000,000 |
Gemini 2.0 Flash | 10,000 | 10,000,000 | * | 1,000,000,000 |
Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | * | 1,000,000,000 |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 सत्र | 10,000,000 | * | * |
Gemini 2.5 Flash Preview Native Audio Dialog | 100 सेशन | 1,000,000 | * | * |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 सत्र | 25,000 | 50 | * |
Gemini 2.0 Flash Live | 1,000 सत्र | 10,000,000 | * | * |
मल्टी-मॉडल जनरेशन मॉडल | ||||
Gemini 2.5 Flash Preview TTS | 1,000 | 1,00,000 | 10,000 | * |
Gemini 2.5 Pro Preview TTS | 100 | 25,000 | 1,000 | * |
Gemini 2.5 Flash की इमेज प्रीव्यू करने की सुविधा | 2,000 | 1,500,000 | 50,000 | * |
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक | 2,000 | 30,00,000 | 1,00,000 | * |
Imagen 4 Standard/Fast | 15 | * | 1000 | * |
Imagen 4 Ultra | 10 | * | 400 | * |
Imagen 3 | 20 | * | * | * |
Veo 3 | 4 | * | 50 | * |
Veo 3 Fast | 4 | * | 50 | * |
Veo 2 | 2 | * | 50 | * |
अन्य मॉडल | ||||
Gemma 3 और 3n | 30 | 15,000 | 14,400 | * |
Gemini Embedding | 5,000 | 5,000,000 | * | * |
अब काम नहीं करने वाले मॉडल | ||||
Gemini 1.5 Flash (अब इस्तेमाल नहीं किया जा सकता) | 2,000 | 40,00,000 | * | * |
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) | 4,000 | 40,00,000 | * | * |
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जा सकता) | 1,000 | 40,00,000 | * | * |
टियर 3
मॉडल | आरपीएम | टीपीएम | RPD | बैच में शामिल किए गए टोकन |
---|---|---|---|---|
टेक्स्ट-आउट मॉडल | ||||
Gemini 2.5 Pro | 2,000 | 8,000,000 | * | 1,000,000,000 |
Gemini 2.5 Flash | 10,000 | 8,000,000 | * | 1,000,000,000 |
Gemini 2.5 Flash-Lite | 30,000 | 3,00,00,000 | * | 1,000,000,000 |
Gemini 2.0 Flash | 30,000 | 3,00,00,000 | * | 5,000,000,000 |
Gemini 2.0 Flash-Lite | 30,000 | 3,00,00,000 | * | 5,000,000,000 |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 सत्र | 10,000,000 | * | * |
Gemini 2.5 Flash Preview Native Audio Dialog | 100 सेशन | 1,000,000 | * | * |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 सत्र | 25,000 | 50 | * |
Gemini 2.0 Flash Live | 1,000 सत्र | 10,000,000 | * | * |
मल्टी-मॉडल जनरेशन मॉडल | ||||
Gemini 2.5 Flash Preview TTS | 1,000 | 1,000,000 | * | * |
Gemini 2.5 Pro Preview TTS | 100 | 1,000,000 | * | * |
Gemini 2.5 Flash की इमेज प्रीव्यू करने की सुविधा | 5,000 | 5,000,000 | * | * |
Gemini 2.0 Flash की मदद से इमेज जनरेट करने की सुविधा की झलक | 5,000 | 5,000,000 | * | * |
Imagen 4 Standard/Fast | 20 | * | 15,000 | * |
Imagen 4 Ultra | 15 | * | 5,000 | * |
Imagen 3 | 20 | * | * | * |
Veo 3 | 10 | * | 500 | * |
Veo 3 Fast | 10 | * | 500 | * |
Veo 2 | 2 | * | 50 | * |
अन्य मॉडल | ||||
Gemma 3 और 3n | 30 | 15,000 | 14,400 | * |
Gemini Embedding | 10,000 | 10,000,000 | * | * |
अब काम नहीं करने वाले मॉडल | ||||
Gemini 1.5 Flash (अब इस्तेमाल नहीं किया जा सकता) | 2,000 | 40,00,000 | * | * |
Gemini 1.5 Flash-8B (अब उपलब्ध नहीं है) | 4,000 | 40,00,000 | * | * |
Gemini 1.5 Pro (अब इस्तेमाल नहीं किया जा सकता) | 1,000 | 40,00,000 | * | * |
तय की गई दर की सीमाओं की गारंटी नहीं दी जाती. साथ ही, असल क्षमता अलग-अलग हो सकती है.
बैच एपीआई के लिए रेट लिमिट
Batch API के अनुरोधों पर, दर की अपनी सीमाएं लागू होती हैं. ये सीमाएं, नॉन-बैच एपीआई कॉल से अलग होती हैं.
- एक साथ किए जाने वाले बैच अनुरोध: 100
- इनपुट फ़ाइल का साइज़: 2 जीबी
- फ़ाइल स्टोरेज की सीमा: 20 जीबी
- हर मॉडल के लिए, लाइन में लगे टोकन: दर की सीमाओं वाली टेबल के बैच में लाइन में लगे टोकन कॉलम में, किसी मॉडल के लिए बैच प्रोसेसिंग के लिए लाइन में लगाए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या दी गई होती है. यह संख्या, आपके सभी चालू बैच जॉब के लिए होती है. एपीआई के लिए अनुरोध करने की स्टैंडर्ड सीमाओं वाली टेबल में देखें.
अगले टियर पर अपग्रेड करने का तरीका
Gemini API, बिलिंग से जुड़ी सभी सेवाओं के लिए Cloud Billing का इस्तेमाल करता है. मुफ़्त टियर से पैसे चुकाकर लिए जाने वाले टियर पर स्विच करने के लिए, आपको सबसे पहले अपने Google Cloud प्रोजेक्ट के लिए Cloud Billing की सुविधा चालू करनी होगी.
जब आपका प्रोजेक्ट तय की गई शर्तों को पूरा कर लेता है, तब उसे अगले टियर में अपग्रेड किया जा सकता है. अपग्रेड करने का अनुरोध करने के लिए, यह तरीका अपनाएं:
- AI Studio में एपीआई पासकोड पेज पर जाएं.
- वह प्रोजेक्ट ढूंढें जिसे अपग्रेड करना है. इसके बाद, "अपग्रेड करें" पर क्लिक करें. "अपग्रेड करें" विकल्प सिर्फ़ उन प्रोजेक्ट के लिए दिखेगा जो अगले टियर की ज़रूरी शर्तें पूरी करते हैं.
पुष्टि हो जाने के बाद, प्रोजेक्ट को अगले टियर में अपग्रेड कर दिया जाएगा.
अनुरोधों की संख्या बढ़ाने का अनुरोध करना
हर मॉडल वेरिएशन के लिए, अनुरोधों की संख्या की सीमा (हर मिनट में किए जाने वाले अनुरोध, आरपीएम) तय की गई है. इन सीमाओं के बारे में जानने के लिए, Gemini मॉडल देखें.
पैसे चुकाकर ली जाने वाली सदस्यता के लिए, अनुरोधों की संख्या बढ़ाने का अनुरोध करना
हम दर की सीमा बढ़ाने की कोई गारंटी नहीं देते, लेकिन हम आपके अनुरोध की समीक्षा करने की पूरी कोशिश करेंगे.