अनुरोधों की दर से जुड़ी सीमाओं से यह तय होता है कि किसी तय समयसीमा में, Gemini API को कितने अनुरोध किए जा सकते हैं. इन सीमाओं से, सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने, गलत इस्तेमाल को रोकने, और उचित इस्तेमाल को बनाए रखने में मदद मिलती है.
AI Studio में, दर से जुड़ी लागू सीमाएं देखना
अनुरोध करने की सीमाएं कैसे काम करती हैं
आम तौर पर, दर की सीमाओं को तीन डाइमेंशन के हिसाब से मापा जाता है:
- हर मिनट में किए गए अनुरोधों की संख्या (आरपीएम)
- हर मिनट इस्तेमाल किए जाने वाले टोकन (इनपुट) (टीपीएम)
- हर दिन के हिसाब से अनुरोध (RPD)
आपके इस्तेमाल का आकलन हर सीमा के हिसाब से किया जाता है. किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, दर की सीमा से जुड़ी गड़बड़ी ट्रिगर होगी. उदाहरण के लिए, अगर आपकी आरपीएम सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.
दर सीमाएं, हर प्रोजेक्ट पर लागू होती हैं, न कि हर एपीआई कुंजी पर. हर दिन के अनुरोध (RPD) का कोटा, पैसिफ़िक टाइम के मुताबिक आधी रात को रीसेट होता है.
इस्तेमाल की सीमाएं, इस्तेमाल किए जा रहे मॉडल के हिसाब से अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ चुनिंदा मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज प्रति मिनट या आईपीएम की गिनती सिर्फ़ इमेज जनरेट करने वाले मॉडल (Nano Banana) के लिए की जाती है. हालांकि, यह टीपीएम से मिलता-जुलता है. अन्य मॉडल के लिए, हर दिन इस्तेमाल किए जा सकने वाले टोकन की सीमा (टीपीडी) तय की जा सकती है.
एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएं ज़्यादा प्रतिबंधित होती हैं.
खर्च के आधार पर तय की गई दर की सीमाएं
Gemini API, एक मिनट में किए जा सकने वाले अनुरोधों (आरपीएम) और एक मिनट में इस्तेमाल किए जा सकने वाले टोकन (टीपीएम) की सीमाओं के अलावा, खर्च के आधार पर दर की सीमाएं भी लागू करता है. इससे, उपयोगकर्ताओं को अनचाहे शुल्क से बचाया जा सकता है. ये सीमाएं आपके खाते पर लागू होंगी या नहीं, यह आपकी बिलिंग के इतिहास और इस्तेमाल के टियर पर निर्भर करता है.
यहां दी गई टेबल में, हर इस्तेमाल के टियर के लिए, खर्च के आधार पर तय की गई दर की सीमाएं दिखाई गई हैं. इन सीमाओं का आकलन, 10 मिनट की रोलिंग विंडो के आधार पर किया जाता है. ये सीमाएं आपके खाते पर लागू होती हैं या नहीं, यह आपके बिलिंग इतिहास और खाते की स्थिति पर निर्भर करता है.
| इस्तेमाल का टियर | खर्च करने की दर की सीमा (हर 10 मिनट में) |
|---|---|
| Free | लागू नहीं |
| टियर 1 | $10 |
| टियर 2 | 200 डॉलर |
| टियर 3 | 200 डॉलर |
खर्च के आधार पर तय की गई सीमा पूरी होने पर, एपीआई 429 RESOURCE_EXHAUSTED
गड़बड़ी का मैसेज दिखाता है. इस समस्या को हल करने के लिए:
- कुछ समय बाद, इंतज़ार करें और फिर से कोशिश करें.
- ज़्यादा कीमत वाले अनुरोधों की दर कम करें. उदाहरण के लिए, छोटी कॉन्टेक्स्ट विंडो या छोटे आउटपुट का इस्तेमाल करें.
- अगर आपको सामान्य इस्तेमाल के दौरान लगातार इस सीमा का सामना करना पड़ता है, तो दर की सीमा बढ़ाने का अनुरोध करें.
इस्तेमाल के टियर
दर से जुड़ी सीमाएं, प्रोजेक्ट के इस्तेमाल के टियर से जुड़ी होती हैं. एपीआई का इस्तेमाल और खर्च बढ़ने पर, आपको अपने-आप अपग्रेड करके ज़्यादा दर सीमा वाला बेहतर टियर मिल जाएगा.
दूसरे और तीसरे टियर के लिए ज़रूरी शर्तें, Google Cloud की सेवाओं (इसमें Gemini API भी शामिल है) पर किए गए कुल खर्च के आधार पर तय की जाती हैं. यह खर्च, आपके प्रोजेक्ट से लिंक किए गए बिलिंग खाते से किया गया होना चाहिए.
| इस्तेमाल का टियर | क्वालिफ़िकेशन राउंड | बिलिंग टियर कैप |
|---|---|---|
| Free | चालू प्रोजेक्ट या बिना किसी शुल्क के आज़माने की सुविधा | लागू नहीं |
| टियर 1 | चालू बिलिंग खाता सेट अप करना और उसे लिंक करना | 250 डॉलर |
| टियर 2 | पहली बार पेमेंट पूरा होने के तीन दिन बाद, 100 डॉलर का पेमेंट किया गया | 2,000 डॉलर |
| टियर 3 | पहली बार पेमेंट पूरा होने के 30 दिन बाद, 1,000 डॉलर का पेमेंट किया गया | 20,000 से 1,00,000 डॉलर से ज़्यादा |
आम तौर पर, ज़रूरी शर्तें पूरी करने पर ही अपग्रेड करने का अनुरोध स्वीकार कर लिया जाता है. हालांकि, कुछ मामलों में समीक्षा के दौरान मिले अन्य तथ्यों के आधार पर, अपग्रेड करने का अनुरोध अस्वीकार किया जा सकता है.
यह सिस्टम, सभी उपयोगकर्ताओं के लिए Gemini API प्लैटफ़ॉर्म की सुरक्षा और अखंडता बनाए रखने में मदद करता है.
Gemini API के लिए अनुरोध करने की सीमाएँ
दर की सीमाएं कई बातों पर निर्भर करती हैं. जैसे, इस्तेमाल का टियर. इन्हें Google AI Studio में देखा जा सकता है. समय के साथ-साथ, आपके टियर और खाते की स्थिति में बदलाव होता रहता है. इसलिए, दर की सीमाएं अपने-आप अपडेट हो जाएंगी.
AI Studio में, दर से जुड़ी लागू सीमाएं देखना
तय की गई दर की सीमाओं की गारंटी नहीं दी जाती. साथ ही, असल क्षमता अलग-अलग हो सकती है.
प्राथमिकता का अनुमान लगाने के लिए, अनुरोधों की तय सीमाएं
प्राथमिकता के आधार पर इस्तेमाल किए जाने वाले संसाधनों के लिए, दर की अपनी सीमाएं होती हैं. भले ही, इस्तेमाल को इंटरैक्टिव ट्रैफ़िक की दर की कुल सीमाओं में गिना जाता हो. डिफ़ॉल्ट रेट लिमिट ये हैं: हर मॉडल और टियर के लिए, स्टैंडर्ड रेट लिमिट का 0.3 गुना
बैच एपीआई के इस्तेमाल की दर से जुड़ी सीमाएं
Batch API अनुरोधों के लिए, दर की सीमाएं अलग से तय की जाती हैं. ये सीमाएं, नॉन-बैच एपीआई कॉल से अलग होती हैं.
- एक साथ किए गए बैच अनुरोध: 100
- इनपुट फ़ाइल का साइज़: 2 जीबी
- फ़ाइल स्टोरेज की सीमा: 20 जीबी
- हर मॉडल के लिए, लाइन में लगे टोकन: बैच में लाइन में लगे टोकन टेबल में, किसी मॉडल के लिए बैच प्रोसेसिंग के लिए लाइन में लगाए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या दी गई होती है. यह संख्या, बैच प्रोसेसिंग के लिए चालू किए गए सभी जॉब के लिए होती है.
टियर 1
| मॉडल | बैच में शामिल किए गए टोकन | |||
|---|---|---|---|---|
| टेक्स्ट-आउट मॉडल | ||||
| Gemini 3.1 Pro की झलक | 5,000,000 | |||
| Gemini 3.1 Flash-Lite | 10,000,000 | |||
| Gemini 3.1 Flash-Lite की झलक | 10,000,000 | |||
| Gemini 3.5 Flash | 30,00,000 | |||
| Gemini 3.5 Flash | 30,00,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Gemini 2.5 Pro TTS | 25,000 | |||
| Gemini 2.5 Flash | 30,00,000 | |||
| Gemini 2.5 Flash का प्रीव्यू | 30,00,000 | |||
| Gemini 2.5 Flash की इमेज का प्रीव्यू | 30,00,000 | |||
| Gemini 2.5 Flash TTS | 1,00,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.5 Flash-Lite का प्रीव्यू | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| Gemini 2.0 Flash Image | 30,00,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| मल्टी-मोडल जनरेशन मॉडल | ||||
| Gemini 3.1 Flash की इमेज का प्रीव्यू 🍌 | 1,000,000 | |||
| Gemini 3 Pro की इमेज की झलक 🍌 | 2,000,000 | |||
| मॉडल एम्बेड करना | ||||
| Gemini Embedding | 500,000 | |||
टियर 2
| मॉडल | बैच में शामिल किए गए टोकन | |||
|---|---|---|---|---|
| टेक्स्ट-आउट मॉडल | ||||
| Gemini 3.1 Pro की झलक | 500,000,000 | |||
| Gemini 3.1 Flash-Lite | 500,000,000 | |||
| Gemini 3.1 Flash-Lite की झलक | 500,000,000 | |||
| Gemini 3.5 Flash | 400,000,000 | |||
| Gemini 3.5 Flash | 400,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Gemini 2.5 Pro TTS | 1,00,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash का प्रीव्यू | 400,000,000 | |||
| Gemini 2.5 Flash की इमेज का प्रीव्यू | 400,000,000 | |||
| Gemini 2.5 Flash TTS | 1,00,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.5 Flash-Lite का प्रीव्यू | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash Image | 400,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| मल्टी-मोडल जनरेशन मॉडल | ||||
| Gemini 3.1 Flash की इमेज का प्रीव्यू 🍌 | 25,00,00,000 | |||
| Gemini 3 Pro की इमेज की झलक 🍌 | 27 करोड़ | |||
| मॉडल एम्बेड करना | ||||
| Gemini Embedding | 5,000,000 | |||
टियर 3
| मॉडल | बैच में शामिल किए गए टोकन | |||
|---|---|---|---|---|
| टेक्स्ट-आउट मॉडल | ||||
| Gemini 3.1 Pro की झलक | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite की झलक | 1,000,000,000 | |||
| Gemini 3.5 Flash | 1,000,000,000 | |||
| Gemini 3.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Gemini 2.5 Pro TTS | 1,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash का प्रीव्यू | 1,000,000,000 | |||
| Gemini 2.5 Flash की इमेज का प्रीव्यू | 1,000,000,000 | |||
| Gemini 2.5 Flash TTS | 40,00,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite का प्रीव्यू | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| Gemini 2.0 Flash Image | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| मल्टी-मोडल जनरेशन मॉडल | ||||
| Gemini 3.1 Flash की इमेज का प्रीव्यू 🍌 | 750,000,000 | |||
| Gemini 3 Pro की इमेज की झलक 🍌 | 1,000,000,000 | |||
| मॉडल एम्बेड करना | ||||
| Gemini Embedding | 10,000,000 | |||
अगले टियर पर अपग्रेड करने का तरीका
मुफ़्त टियर से पैसे चुकाकर ली जाने वाली सदस्यता पर स्विच करने के लिए, आपको सबसे पहले AI Studio में बिलिंग सेट अप करनी होगी.
जब आपका प्रोजेक्ट तय की गई शर्तों को पूरा कर लेगा, तब उसे अगले टियर में अपने-आप अपग्रेड कर दिया जाएगा. मुफ़्त टियर से टियर 1 में अपग्रेड करने पर, आम तौर पर बदलाव तुरंत लागू हो जाते हैं. इसके बाद, टियर अपग्रेड करने पर बदलाव 10 मिनट के अंदर लागू हो जाते हैं. अपने टियर देखने के लिए, AI Studio में प्रोजेक्ट पेज पर जाएं.
अनुरोधों की संख्या बढ़ाने का अनुरोध करना
मॉडल के हर वर्शन के लिए, दर की सीमा (हर मिनट में अनुरोध, आरपीएम) तय की जाती है. इन रेट लिमिट के बारे में जानने के लिए, AI Studio की रेट लिमिट पेज पर जाएं.
पैसे चुकाकर ली जाने वाली सदस्यता के लिए, अनुरोधों की संख्या बढ़ाने का अनुरोध करना
हम दर की सीमा बढ़ाने की कोई गारंटी नहीं देते, लेकिन हम आपके अनुरोध की समीक्षा करने की पूरी कोशिश करेंगे.