दर की सीमाएं, किसी तय समयसीमा के दौरान Gemini API को किए जा सकने वाले अनुरोधों की संख्या को कंट्रोल करती हैं. इन सीमाओं से, सही तरीके से इस्तेमाल करने, गलत इस्तेमाल से बचाने, और सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस बनाए रखने में मदद मिलती है.
दर से जुड़ी सीमाएं कैसे काम करती हैं
आम तौर पर, दर की सीमाओं को तीन डाइमेंशन में मेज़र किया जाता है:
- हर मिनट मिलने वाले अनुरोध (आरपीएम)
- हर दिन मिलने वाले अनुरोध (आरपीडी)
- हर मिनट के हिसाब से टोकन (इनपुट) (TPM)
आपके इस्तेमाल का आकलन, हर सीमा के हिसाब से किया जाता है. इनमें से किसी भी सीमा को पार करने पर, रेट की सीमा से जुड़ी गड़बड़ी का मैसेज दिखेगा. उदाहरण के लिए, अगर आपके आरपीएम की सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी का मैसेज दिखेगा. भले ही, आपने टीपीएम या अन्य सीमाओं को पार न किया हो.
दर की सीमाएं हर प्रोजेक्ट के हिसाब से लागू होती हैं, न कि हर एपीआई पासकोड के हिसाब से.
इस्तेमाल किए जा रहे मॉडल के हिसाब से सीमाएं अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ कुछ मॉडल पर लागू होती हैं. उदाहरण के लिए, हर मिनट में जनरेट की गई इमेज या आईपीएम का हिसाब, सिर्फ़ इमेज जनरेट करने वाले मॉडल (Imagen 3) के लिए लगाया जाता है. हालांकि, यह सिद्धांत रूप से टीपीएम जैसा ही है. अन्य मॉडल के लिए, हर दिन के टोकन की सीमा (टीपीडी) तय की जा सकती है.
एक्सपेरिमेंट के तौर पर उपलब्ध और झलक वाले मॉडल के लिए, रेटिंग की सीमाएं ज़्यादा होती हैं.
इस्तेमाल के टीयर
दर की सीमाएं, प्रोजेक्ट के इस्तेमाल के टीयर से जुड़ी होती हैं. एपीआई के इस्तेमाल और खर्च में बढ़ोतरी होने पर, आपके पास ज़्यादा दर की सीमाओं के साथ, किसी ज़्यादा टीयर पर अपग्रेड करने का विकल्प होगा.
टियर | क्वालिफ़िकेशन |
---|---|
मुफ़्त | ज़रूरी शर्तें पूरी करने वाले देशों में रहने वाले उपयोगकर्ता |
टियर 1 | प्रोजेक्ट से जुड़ा बिलिंग खाता |
टियर 2 | कुल खर्च: 250 डॉलर से ज़्यादा और पेमेंट होने के कम से कम 30 दिन हो गए हों |
टियर 3 | कुल खर्च: 1,000 डॉलर से ज़्यादा और पेमेंट होने के कम से कम 30 दिन हो गए हों |
अपग्रेड का अनुरोध करने पर, गलत इस्तेमाल से बचाने वाला हमारा ऑटोमेटेड सिस्टम, कुछ और जांच करता है. आम तौर पर, ज़रूरी शर्तें पूरी करने पर ही अनुमति मिलती है. हालांकि, कुछ मामलों में समीक्षा की प्रोसेस के दौरान पता चलने वाली अन्य वजहों के आधार पर, अपग्रेड के अनुरोध को अस्वीकार किया जा सकता है.
इस सिस्टम की मदद से, सभी उपयोगकर्ताओं के लिए Gemini API प्लैटफ़ॉर्म को सुरक्षित और भरोसेमंद बनाए रखा जाता है.
एपीआई के लिए तय की गई स्टैंडर्ड दर की सीमाएं
यहां दी गई टेबल में, Gemini API के सभी स्टैंडर्ड कॉल के लिए, दर की सीमाएं दी गई हैं.
फ़्री टियर
मॉडल | आरपीएम | टीपीएम | आरपीडी |
---|---|---|---|
टेक्स्ट-आउट मॉडल | |||
Gemini 2.5 Pro | 5 | 250,000 | 100 |
Gemini 2.5 Flash | 10 | 250,000 | 250 |
Gemini 2.5 Flash-Lite की झलक 17-06 | 15 | 250,000 | 1,000 |
Gemini 2.0 Flash | 15 | 1,000,000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
Live API | |||
Gemini 2.5 Flash Live | 3 सत्र | 1,000,000 | |
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग | 1 सत्र | 25,000 | 5 |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 सत्र | 10,000 | 5 |
Gemini 2.0 Flash Live | 3 सत्र | 1,000,000 | |
अलग-अलग मोड में कॉन्टेंट जनरेट करने वाले मॉडल | |||
Gemini 2.5 Flash Preview TTS | 3 | 10,000 | 15 |
Gemini 2.5 Pro के प्रीव्यू में टीटीएस | |||
Gemini 2.0 Flash की मदद से, झलक वाली इमेज जनरेट करना | 10 | 2,00,000 | 100 |
Imagen 3 | |||
Veo 2 | |||
अन्य मॉडल | |||
Gemma 3 और 3n | 30 | 15,000 | 14,400 |
Gemini Embedding Experimental 03-07 | 5 | 100 | |
अब काम न करने वाले मॉडल | |||
Gemini 1.5 Flash (अब काम नहीं करता) | 15 | 250,000 | 50 |
Gemini 1.5 Flash-8B (अब काम नहीं करता) | 15 | 250,000 | 50 |
Gemini 1.5 Pro (अब काम नहीं करता) |
टियर 1
मॉडल | आरपीएम | टीपीएम | आरपीडी | एक साथ कई टोकन डालना |
---|---|---|---|---|
टेक्स्ट-आउट मॉडल | ||||
Gemini 2.5 Pro | 150 | 2,000,000 | 1,000 | 5,000,000 |
Gemini 2.5 Flash | 1,000 | 1,000,000 | 10,000 | 3,000,000 |
Gemini 2.5 Flash-Lite की झलक 17-06 | 4,000 | 4,000,000 | ||
Gemini 2.0 Flash | 2,000 | 4,000,000 | 10,000,000 | |
Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | 10,000,000 | |
Live API | ||||
Gemini 2.5 Flash Live | 50 सेशन | 4,000,000 | ||
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग | 3 सत्र | 50,000 | 50 | |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 सत्र | 25,000 | 50 | |
Gemini 2.0 Flash Live | 50 सेशन | 4,000,000 | ||
अलग-अलग मोड में कॉन्टेंट जनरेट करने वाले मॉडल | ||||
Gemini 2.5 Flash Preview TTS | 10 | 10,000 | 100 | |
Gemini 2.5 Pro के प्रीव्यू में टीटीएस | 10 | 10,000 | 50 | |
Gemini 2.0 Flash की मदद से, झलक वाली इमेज जनरेट करना | 1,000 | 1,000,000 | 10,000 | |
Imagen 3 | 20 | |||
Imagen 4 स्टैंडर्ड | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Veo 2 | हर मिनट दो वीडियो | हर दिन 50 वीडियो | ||
अन्य मॉडल | ||||
Gemma 3 और 3n | 30 | 15,000 | 14,400 | |
Gemini Embedding Experimental 03-07 | 10 | 1,000 | ||
अब काम न करने वाले मॉडल | ||||
Gemini 1.5 Flash (अब काम नहीं करता) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (अब काम नहीं करता) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (अब काम नहीं करता) | 1,000 | 4,000,000 |
टियर 2
मॉडल | आरपीएम | टीपीएम | आरपीडी | एक साथ कई टोकन डालना |
---|---|---|---|---|
टेक्स्ट-आउट मॉडल | ||||
Gemini 2.5 Pro | 1,000 | 5,000,000 | 50,000 | 500,000,000 |
Gemini 2.5 Flash | 2,000 | 3,000,000 | 1,00,000 | 400,000,000 |
Gemini 2.5 Flash-Lite की झलक 17-06 | 10,000 | 10,000,000 | 1,00,000 | |
Gemini 2.0 Flash | 10,000 | 10,000,000 | 1,000,000,000 | |
Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | 1,000,000,000 | |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 सत्र | 10,000,000 | ||
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग | 100 सेशन | 1,000,000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 सत्र | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 सत्र | 10,000,000 | ||
अलग-अलग मोड में कॉन्टेंट जनरेट करने वाले मॉडल | ||||
Gemini 2.5 Flash Preview TTS | 1,000 | 1,00,000 | 10,000 | |
Gemini 2.5 Pro के प्रीव्यू में टीटीएस | 100 | 25,000 | 1,000 | |
Gemini 2.0 Flash की मदद से, झलक वाली इमेज जनरेट करना | 2,000 | 3,000,000 | 1,00,000 | |
Imagen 3 | 20 | |||
Imagen 4 स्टैंडर्ड | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Veo 2 | हर मिनट दो वीडियो | हर दिन 50 वीडियो | ||
अन्य मॉडल | ||||
Gemma 3 और 3n | 30 | 15,000 | 14,400 | |
Gemini Embedding Experimental 03-07 | 10 | 1,000 | ||
अब काम न करने वाले मॉडल | ||||
Gemini 1.5 Flash (अब काम नहीं करता) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (अब काम नहीं करता) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (अब काम नहीं करता) | 1,000 | 4,000,000 |
टियर 3
मॉडल | आरपीएम | टीपीएम | आरपीडी | एक साथ कई टोकन डालना |
---|---|---|---|---|
टेक्स्ट-आउट मॉडल | ||||
Gemini 2.5 Pro | 2,000 | 8,000,000 | 1,000,000,000 | |
Gemini 2.5 Flash | 10,000 | 8,000,000 | 1,000,000,000 | |
Gemini 2.5 Flash-Lite की झलक 17-06 | 30,000 | 3,00,00,000 | ||
Gemini 2.0 Flash | 30,000 | 3,00,00,000 | 5,000,000,000 | |
Gemini 2.0 Flash-Lite | 30,000 | 3,00,00,000 | 5,000,000,000 | |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 सत्र | 10,000,000 | ||
Gemini 2.5 Flash की झलक दिखाने वाला नेटिव ऑडियो डायलॉग | 100 सेशन | 1,000,000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 सत्र | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 सत्र | 10,000,000 | ||
अलग-अलग मोड में कॉन्टेंट जनरेट करने वाले मॉडल | ||||
Gemini 2.5 Flash Preview TTS | 1,000 | 1,000,000 | ||
Gemini 2.5 Pro के प्रीव्यू में टीटीएस | 100 | 1,000,000 | ||
Gemini 2.0 Flash की मदद से, झलक वाली इमेज जनरेट करना | 5,000 | 5,000,000 | ||
Imagen 3 | 20 | |||
Imagen 4 स्टैंडर्ड | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Veo 2 | हर मिनट दो वीडियो | हर दिन 50 वीडियो | ||
अन्य मॉडल | ||||
Gemma 3 और 3n | 30 | 15,000 | 14,400 | |
Gemini Embedding Experimental 03-07 | 10 | 1,000 | ||
अब काम न करने वाले मॉडल | ||||
Gemini 1.5 Flash (अब काम नहीं करता) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (अब काम नहीं करता) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (अब काम नहीं करता) | 1,000 | 4,000,000 |
किराये की तय सीमा की गारंटी नहीं है. साथ ही, असल क्षमता अलग-अलग हो सकती है.
एक साथ कई क्वेरी भेजने की सुविधा के लिए, रेट लिमिट
बैच मोड के अनुरोधों के लिए, दर की सीमाएं अलग से तय होती हैं. ये सीमाएं, बैच मोड के अलावा अन्य मोड में किए जाने वाले एपीआई कॉल के लिए तय की गई सीमाओं से अलग होती हैं.
- एक साथ कई अनुरोध: 100
- इनपुट फ़ाइल का साइज़: 2 जीबी
- फ़ाइल के स्टोरेज की सीमा: 20 जीबी
- हर मॉडल के लिए, सूची में जोड़े गए टोकन: यहां दी गई टेबल में, किसी मॉडल के लिए आपकी सभी चालू बैच जॉब में, बैच प्रोसेसिंग के लिए ज़्यादा से ज़्यादा कितने टोकन जोड़े जा सकते हैं, इसकी जानकारी दी गई है.
अगले टीयर पर अपग्रेड करने का तरीका
Gemini API, सभी बिलिंग सेवाओं के लिए Cloud Billing का इस्तेमाल करता है. मुफ़्त टीयर से पैसे चुकाकर ली जाने वाली सदस्यता पर स्विच करने के लिए, आपको सबसे पहले अपने Google Cloud प्रोजेक्ट के लिए Cloud Billing की सुविधा चालू करनी होगी.
आपका प्रोजेक्ट तय की गई शर्तें पूरी करने के बाद, अगले टीयर पर अपग्रेड हो जाता है. अपग्रेड का अनुरोध करने के लिए, यह तरीका अपनाएं:
- AI Studio में, एपीआई पासकोड पेज पर जाएं.
- वह प्रोजेक्ट ढूंढें जिसे अपग्रेड करना है और "अपग्रेड करें" पर क्लिक करें. "अपग्रेड करें" विकल्प सिर्फ़ उन प्रोजेक्ट के लिए दिखेगा जो अगले टीयर की ज़रूरी शर्तें पूरी करते हैं.
तुरंत पुष्टि करने के बाद, प्रोजेक्ट को अगले टीयर पर अपग्रेड कर दिया जाएगा.
शुल्क की सीमा बढ़ाने का अनुरोध करना
हर मॉडल वैरिएशन के लिए, अनुरोध की दर (हर मिनट में अनुरोध, आरपीएम) की सीमा तय होती है. दर से जुड़ी सीमाओं के बारे में जानने के लिए, Gemini मॉडल देखें.
पैसे चुकाकर ली जाने वाली सदस्यता के लिए, गति की सीमा बढ़ाने का अनुरोध करना
हम इस बात की कोई गारंटी नहीं देते कि आपके लिए किराये की सीमा बढ़ाई जाएगी. हालांकि, हम आपके अनुरोध की समीक्षा करने की पूरी कोशिश करेंगे.