अनुरोधों की संख्या सीमित करने से, यह तय होता है कि किसी तय समयसीमा में Gemini API को कितने अनुरोध किए जा सकते हैं. इन सीमाओं से, सही तरीके से इस्तेमाल करने, गलत इस्तेमाल से बचाने, और सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने में मदद मिलती है.
AI Studio में, दर से जुड़ी लागू सीमाएं देखना
अनुरोध करने की सीमाएं कैसे काम करती हैं
दर की सीमाओं को आम तौर पर तीन डाइमेंशन के हिसाब से मापा जाता है:
- हर मिनट में किए गए अनुरोधों की संख्या (आरपीएम)
- हर मिनट इस्तेमाल किए जाने वाले टोकन (इनपुट) (टीपीएम)
- हर दिन के हिसाब से अनुरोध (RPD)
आपके इस्तेमाल का आकलन हर सीमा के हिसाब से किया जाता है. किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, दर की सीमा से जुड़ी गड़बड़ी ट्रिगर होगी. उदाहरण के लिए, अगर आपकी आरपीएम सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.
अनुरोध की संख्या की सीमाएं, हर प्रोजेक्ट पर लागू होती हैं, न कि हर एपीआई कुंजी पर. हर दिन के अनुरोध (RPD) के कोटे, पैसिफ़िक समय के मुताबिक आधी रात को रीसेट होते हैं.
इस्तेमाल की सीमाएं, इस्तेमाल किए जा रहे मॉडल के हिसाब से अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ खास मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज पर मिनट या IPM की गिनती सिर्फ़ इमेज जनरेट करने वाले मॉडल (Imagen 3) के लिए की जाती है. हालांकि, यह टीपीएम से मिलता-जुलता है. अन्य मॉडल के लिए, हर दिन इस्तेमाल किए जा सकने वाले टोकन की सीमा (टीपीडी) तय की जा सकती है.
एक्सपेरिमेंट के तौर पर उपलब्ध और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएँ ज़्यादा प्रतिबंधित होती हैं.
इस्तेमाल के टियर
दर से जुड़ी सीमाएं, प्रोजेक्ट के इस्तेमाल के टियर से जुड़ी होती हैं. एपीआई के इस्तेमाल और खर्च में बढ़ोतरी होने पर, आपके पास ज़्यादा दर की सीमाओं के साथ उच्च स्तर पर अपग्रेड करने का विकल्प होगा.
दूसरे और तीसरे टियर के लिए ज़रूरी शर्तें, Google Cloud की सेवाओं (इनमें Gemini API भी शामिल है) पर किए गए कुल खर्च के आधार पर तय की जाती हैं. यह खर्च, आपके प्रोजेक्ट से लिंक किए गए बिलिंग खाते से किया जाता है.
| टियर | क्वालिफ़िकेशन |
|---|---|
| मुफ़्त | ज़रूरी शर्तें पूरी करने वाले देशों में रहने वाले उपयोगकर्ता |
| टियर 1 | पूरी तरह से पेमेंट किया गया बिलिंग खाता, प्रोजेक्ट से लिंक होना चाहिए |
| टियर 2 | कुल खर्च: > 250 डॉलर और पेमेंट को मंज़ूरी मिले हुए कम से कम 30 दिन हो गए हों |
| टियर 3 | कुल खर्च: > 1,000 डॉलर और पेमेंट को मंज़ूरी मिले हुए कम से कम 30 दिन हो गए हों |
अपग्रेड का अनुरोध करने पर, बुरे बर्ताव से बचाने वाला हमारा ऑटोमेटेड सिस्टम, अतिरिक्त जांच करता है. ज़रूरी शर्तें पूरी करने पर, आम तौर पर अपग्रेड करने का अनुरोध स्वीकार कर लिया जाता है. हालांकि, कुछ मामलों में समीक्षा के दौरान मिले अन्य तथ्यों के आधार पर, अपग्रेड करने का अनुरोध अस्वीकार किया जा सकता है.
यह सिस्टम, सभी उपयोगकर्ताओं के लिए Gemini API प्लैटफ़ॉर्म की सुरक्षा और अखंडता बनाए रखने में मदद करता है.
Gemini API के इस्तेमाल की दर से जुड़ी सीमाएं
दर की सीमाएं कई बातों पर निर्भर करती हैं. जैसे, आपका कोटा टियर. इन्हें Google AI Studio में देखा जा सकता है. समय के साथ-साथ, आपके टियर और खाते की स्थिति में बदलाव होता रहता है. इसलिए, दर की सीमाएं अपने-आप अपडेट हो जाएंगी.
AI Studio में, दर से जुड़ी लागू सीमाएं देखना
तय की गई दर की सीमाओं की गारंटी नहीं दी जाती. साथ ही, असल क्षमता अलग-अलग हो सकती है.
बैच एपीआई के लिए रेट लिमिट
Batch API के अनुरोधों पर, दर की अपनी सीमाएं लागू होती हैं. ये सीमाएं, नॉन-बैच एपीआई कॉल से अलग होती हैं.
- एक साथ किए जाने वाले बैच अनुरोध: 100
- इनपुट फ़ाइल का साइज़: 2 जीबी
- फ़ाइल स्टोरेज की सीमा: 20 जीबी
- हर मॉडल के लिए, लाइन में लगे टोकन: दर सीमा की टेबल में मौजूद बैच में लाइन में लगे टोकन कॉलम में, किसी मॉडल के लिए बैच प्रोसेसिंग के लिए लाइन में लगाए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या दी गई होती है. यह संख्या, बैच प्रोसेसिंग के सभी चालू जॉब के लिए होती है. एपीआई के लिए अनुरोध करने की स्टैंडर्ड सीमाओं वाली टेबल में देखें.
टियर 1
| मॉडल | बैच में शामिल किए गए टोकन | |||
|---|---|---|---|---|
| टेक्स्ट-आउट मॉडल | ||||
| Gemini 3 Pro की झलक | 5,00,00,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Gemini 2.5 Flash | 30,00,000 | |||
| Gemini 2.5 Flash की झलक | 30,00,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.5 Flash-Lite की झलक | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| मल्टी-मोडल जनरेशन मॉडल | ||||
| Gemini 3 Pro की इमेज की झलक 🍌 | 2,000,000 | |||
टियर 2
| मॉडल | बैच में शामिल किए गए टोकन | |||
|---|---|---|---|---|
| टेक्स्ट-आउट मॉडल | ||||
| Gemini 3 Pro की झलक | 500,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash की झलक | 400,000,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.5 Flash-Lite की झलक | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| मल्टी-मोडल जनरेशन मॉडल | ||||
| Gemini 3 Pro की इमेज की झलक 🍌 | 27 करोड़ | |||
टियर 3
| बैच में शामिल किए गए टोकन | ||||
|---|---|---|---|---|
| टेक्स्ट-आउट मॉडल | ||||
| Gemini 3 Pro की झलक | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash की झलक | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite की झलक | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| मल्टी-मोडल जनरेशन मॉडल | ||||
| Gemini 3 Pro की इमेज की झलक 🍌 | 5,000 | 5,000,000 | * | 1,000,000,000 |
अगले टियर पर अपग्रेड करने का तरीका
Gemini API, बिलिंग से जुड़ी सभी सेवाओं के लिए Cloud Billing का इस्तेमाल करता है. मुफ़्त टियर से पैसे चुकाकर लिए जाने वाले टियर पर स्विच करने के लिए, आपको सबसे पहले अपने Google Cloud प्रोजेक्ट के लिए Cloud Billing की सुविधा चालू करनी होगी.
जब आपका प्रोजेक्ट तय की गई शर्तों को पूरा कर लेता है, तब उसे अगले टियर में अपग्रेड किया जा सकता है. अपग्रेड करने का अनुरोध करने के लिए, यह तरीका अपनाएं:
- AI Studio में एपीआई पासकोड पेज पर जाएं.
- वह प्रोजेक्ट ढूंढें जिसे अपग्रेड करना है. इसके बाद, "अपग्रेड करें" पर क्लिक करें. "अपग्रेड करें" विकल्प सिर्फ़ उन प्रोजेक्ट के लिए दिखेगा जो अगले टियर की ज़रूरी शर्तें पूरी करते हैं.
पुष्टि हो जाने के बाद, प्रोजेक्ट को अगले टियर में अपग्रेड कर दिया जाएगा.
अनुरोधों की संख्या बढ़ाने का अनुरोध करना
मॉडल के हर वर्शन के लिए, दर की सीमा (हर मिनट में अनुरोध, आरपीएम) तय की जाती है. इन सीमाओं के बारे में जानने के लिए, Gemini मॉडल देखें.
पैसे चुकाकर ली जाने वाली सदस्यता के लिए, अनुरोधों की संख्या बढ़ाने का अनुरोध करना
हम दर की सीमा बढ़ाने की कोई गारंटी नहीं देते, लेकिन हम आपके अनुरोध की समीक्षा करने की पूरी कोशिश करेंगे.