रेट लिमिट से यह तय होता है कि तय समय में, Gemini API के लिए कितने अनुरोध किए जा सकते हैं. इन सीमाओं से, सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने, गलत इस्तेमाल से बचाने, और सही तरीके से इस्तेमाल करने में मदद मिलती है.
AI Studio में, रेट लिमिट देखें
रेट लिमिट कैसे काम करती हैं
रेट लिमिट को आम तौर पर, तीन डाइमेंशन में मापा जाता है:
- हर मिनट में किए जा सकने वाले अनुरोधों की संख्या (RPM)
- हर मिनट में इनपुट किए जा सकने वाले टोकन की संख्या (TPM)
- हर दिन में किए जा सकने वाले अनुरोधों की संख्या (RPD)
आपके इस्तेमाल का आकलन, हर लिमिट के हिसाब से किया जाता है. इनमें से किसी भी लिमिट से ज़्यादा इस्तेमाल करने पर, रेट लिमिट से जुड़ी गड़बड़ी ट्रिगर हो जाएगी. उदाहरण के लिए, अगर आपकी RPM लिमिट 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने अपनी TPM या अन्य लिमिट को पार न किया हो.
रेट लिमिट, हर प्रोजेक्ट पर लागू होती हैं. ये एपीआई कुंजी पर लागू नहीं होतीं. हर दिन किए जा सकने वाले अनुरोधों की संख्या (RPD) का कोटा, पैसिफ़िक टाइम के मुताबिक आधी रात को रीसेट होता है.
लिमिट, इस्तेमाल किए जा रहे मॉडल के हिसाब से अलग-अलग होती हैं. साथ ही, कुछ लिमिट सिर्फ़ चुनिंदा मॉडल पर लागू होती हैं. उदाहरण के लिए, हर मिनट में जनरेट की जा सकने वाली इमेज की संख्या (आईपीएम) की गिनती सिर्फ़ उन मॉडल के लिए की जाती है जो इमेज जनरेट कर सकते हैं. जैसे, Nano Banana. हालांकि, यह कॉन्सेप्ट के हिसाब से टीपीएम के जैसी ही है. अन्य मॉडल के लिए, हर दिन इस्तेमाल किए जा सकने वाले टोकन की संख्या (टीपीडी) की लिमिट हो सकती है.
एक्सपेरिमेंट के तौर पर उपलब्ध और प्रीव्यू के लिए उपलब्ध मॉडल के लिए, रेट लिमिट ज़्यादा पाबंदियों वाली होती हैं.
इस्तेमाल करने से जुड़े टियर
रेट लिमिट, प्रोजेक्ट के इस्तेमाल करने से जुड़े टियर से जुड़ी होती हैं. एपीआई के इस्तेमाल और खर्च में बढ़ोतरी होने पर, आपको ज़्यादा रेट लिमिट वाले अगले टियर में अपने-आप अपग्रेड कर दिया जाएगा.
टियर 2 और 3 के लिए ज़रूरी शर्तें, आपके प्रोजेक्ट से लिंक किए गए बिलिंग खाते के लिए, Google Cloud की सेवाओं (इनमें Gemini API भी शामिल है) पर किए गए कुल खर्च के आधार पर तय की जाती हैं.
| इस्तेमाल करने से जुड़ा टियर | क्वालिफ़िकेशन राउंड | बिलिंग टियर की सीमा |
|---|---|---|
| Free | चालू प्रोजेक्ट या मुफ़्त में आज़माने की सुविधा | लागू नहीं |
| टियर 1 | चालू बिलिंग खाता सेट अप और लिंक करना | 250 डॉलर |
| टियर 2 | पहले पेमेंट के बाद 100 डॉलर + 3 दिन | 2,000 डॉलर |
| टियर 3 | पहले पेमेंट के बाद 1,000 डॉलर + 30 दिन | 20,000 डॉलर - 1,00,000 डॉलर से ज़्यादा |
आम तौर पर, बताई गई ज़रूरी शर्तों को पूरा करने पर, मंज़ूरी मिल जाती है. हालांकि, कुछ मामलों में, समीक्षा के दौरान पता चली अन्य वजहों के आधार पर, अपग्रेड के अनुरोध को अस्वीकार किया जा सकता है.
इस सिस्टम से, सभी उपयोगकर्ताओं के लिए Gemini API प्लैटफ़ॉर्म की सुरक्षा और इंटिग्रिटी को बनाए रखने में मदद मिलती है.
Gemini API की रेट लिमिट
रेट लिमिट कई चीज़ों पर निर्भर करती हैं. जैसे, इस्तेमाल करने से जुड़ा आपका टियर. इन्हें Google AI Studio में देखा जा सकता है. समय के साथ-साथ, आपके टियर और खाते के स्टेटस में बदलाव होने पर, रेट लिमिट अपने-आप अपडेट हो जाएंगी.
AI Studio में, रेट लिमिट देखें
बताई गई रेट लिमिट की गारंटी नहीं दी जाती. असल में, क्षमता अलग-अलग हो सकती है.
प्राथमिकता वाले इन्फ़रेंस की रेट लिमिट
प्राथमिकता वाले इन्फ़रेंस की अपनी रेट लिमिट होती हैं. भले ही, इसके इस्तेमाल को इंटरैक्टिव ट्रैफ़िक की कुल रेट लिमिट में गिना जाता हो. डिफ़ॉल्ट रेट लिमिट ये हैं: हर मॉडल और टियर के लिए, स्टैंडर्ड रेट लिमिट का 0.3 गुना
बैच एपीआई की रेट लिमिट
बैच एपीआई के अनुरोधों पर, अपनी रेट लिमिट लागू होती हैं. ये लिमिट, नॉन-बैच एपीआई कॉल से अलग होती हैं.
- एक साथ किए जा सकने वाले बैच अनुरोध: 100
- इनपुट फ़ाइल के साइज़ की लिमिट: 2 जीबी
- फ़ाइल स्टोरेज की लिमिट: 20 जीबी
- हर मॉडल के लिए, क्यू में शामिल किए जा सकने वाले टोकन की संख्या: बैच में शामिल किए गए टोकन टेबल में, किसी मॉडल के लिए बैच प्रोसेसिंग के लिए, क्यू में शामिल किए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या दिखाई जाती है. यह संख्या, आपके सभी चालू बैच जॉब के लिए होती है.
टियर 1
| मॉडल | बैच में शामिल किए गए टोकन | |||
|---|---|---|---|---|
| टेक्स्ट-आउट मॉडल | ||||
| Gemini 3.1 Pro Preview | 50,00,000 | |||
| Gemini 3.1 Flash-Lite | 1,00,00,000 | |||
| Gemini 3.1 Flash-Lite Preview | 1,00,00,000 | |||
| Gemini 3.5 Flash | 30,00,000 | |||
| Gemini 3.5 Flash | 30,00,000 | |||
| Gemini 2.5 Pro | 50,00,000 | |||
| Gemini 2.5 Pro TTS | 25,000 | |||
| Gemini 2.5 Flash | 30,00,000 | |||
| Gemini 2.5 Flash Preview | 30,00,000 | |||
| Gemini 2.5 Flash Image Preview | 30,00,000 | |||
| Gemini 2.5 Flash TTS | 1,00,000 | |||
| Gemini 2.5 Flash-Lite | 1,00,00,000 | |||
| Gemini 2.5 Flash-Lite Preview | 1,00,00,000 | |||
| Gemini 2.0 Flash | 1,00,00,000 | |||
| Gemini 2.0 Flash Image | 30,00,000 | |||
| Gemini 2.0 Flash-Lite | 1,00,00,000 | |||
| मल्टी-मॉडल जनरेशन मॉडल | ||||
| Gemini 3.1 Flash Image Preview 🍌 | 10,00,000 | |||
| Gemini 3 Pro Image Preview 🍌 | 20,00,000 | |||
| एम्बेड करने वाले मॉडल | ||||
| Gemini Embedding | 5,00,000 | |||
टियर 2
| मॉडल | बैच में शामिल किए गए टोकन | |||
|---|---|---|---|---|
| टेक्स्ट-आउट मॉडल | ||||
| Gemini 3.1 Pro Preview | 50,00,00,000 | |||
| Gemini 3.1 Flash-Lite | 50,00,00,000 | |||
| Gemini 3.1 Flash-Lite Preview | 50,00,00,000 | |||
| Gemini 3.5 Flash | 40,00,00,000 | |||
| Gemini 3.5 Flash | 40,00,00,000 | |||
| Gemini 2.5 Pro | 50,00,00,000 | |||
| Gemini 2.5 Pro TTS | 1,00,000 | |||
| Gemini 2.5 Flash | 40,00,00,000 | |||
| Gemini 2.5 Flash Preview | 40,00,00,000 | |||
| Gemini 2.5 Flash Image Preview | 40,00,00,000 | |||
| Gemini 2.5 Flash TTS | 1,00,000 | |||
| Gemini 2.5 Flash-Lite | 50,00,00,000 | |||
| Gemini 2.5 Flash-Lite Preview | 50,00,00,000 | |||
| Gemini 2.0 Flash | 1,00,00,00,000 | |||
| Gemini 2.0 Flash Image | 40,00,00,000 | |||
| Gemini 2.0 Flash-Lite | 1,00,00,00,000 | |||
| मल्टी-मॉडल जनरेशन मॉडल | ||||
| Gemini 3.1 Flash Image Preview 🍌 | 25,00,00,000 | |||
| Gemini 3 Pro Image Preview 🍌 | 27,00,00,000 | |||
| एम्बेड करने वाले मॉडल | ||||
| Gemini Embedding | 50,00,000 | |||
टियर 3
| मॉडल | बैच में शामिल किए गए टोकन | |||
|---|---|---|---|---|
| टेक्स्ट-आउट मॉडल | ||||
| Gemini 3.1 Pro Preview | 1,00,00,00,000 | |||
| Gemini 3.1 Flash-Lite | 1,00,00,00,000 | |||
| Gemini 3.1 Flash-Lite Preview | 1,00,00,00,000 | |||
| Gemini 3.5 Flash | 1,00,00,00,000 | |||
| Gemini 3.5 Flash | 1,00,00,00,000 | |||
| Gemini 2.5 Pro | 1,00,00,00,000 | |||
| Gemini 2.5 Pro TTS | 10,00,000 | |||
| Gemini 2.5 Flash | 1,00,00,00,000 | |||
| Gemini 2.5 Flash Preview | 1,00,00,00,000 | |||
| Gemini 2.5 Flash Image Preview | 1,00,00,00,000 | |||
| Gemini 2.5 Flash TTS | 40,00,000 | |||
| Gemini 2.5 Flash-Lite | 1,00,00,00,000 | |||
| Gemini 2.5 Flash-Lite Preview | 1,00,00,00,000 | |||
| Gemini 2.0 Flash | 5,00,00,00,000 | |||
| Gemini 2.0 Flash Image | 1,00,00,00,000 | |||
| Gemini 2.0 Flash-Lite | 5,00,00,00,00,000 | |||
| मल्टी-मॉडल जनरेशन मॉडल | ||||
| Gemini 3.1 Flash Image Preview 🍌 | 75,00,00,000 | |||
| Gemini 3 Pro Image Preview 🍌 | 1,00,00,00,000 | |||
| एम्बेड करने वाले मॉडल | ||||
| Gemini Embedding | 1,00,00,000 | |||
अगले टियर पर अपग्रेड करने का तरीका
फ़्री टियर से किसी ऐसे टियर पर जाने के लिए जिसमें पैसे चुकाने पड़ते हैं, आपको सबसे पहले AI Studio में बिलिंग सेट अप करनी होगी.
जब आपका प्रोजेक्ट, तय की गई ज़रूरी शर्तों को पूरा कर लेगा, तो उसे अगले टियर में अपने-आप अपग्रेड कर दिया जाएगा. फ़्री टियर से टियर 1 में अपग्रेड करने में आम तौर पर तुरंत समय लगता है. इसके बाद के टियर में अपग्रेड करने में 10 मिनट लगेंगे. अपने टियर की जानकारी देखने के लिए, AI Studio में प्रोजेक्ट पेज पर जाएं.
रेट लिमिट बढ़ाने का अनुरोध करना
मॉडल के हर वर्शन के लिए, एक रेट लिमिट (हर मिनट में किए जा सकने वाले अनुरोधों की संख्या, RPM) तय की जाती है. इन रेट लिमिट के बारे में ज़्यादा जानकारी के लिए, AI Studio की रेट लिमिट वाला पेज देखें.
पैसे चुकाकर इस्तेमाल किए जाने वाले टियर की रेट लिमिट बढ़ाने का अनुरोध करना
हम आपकी रेट लिमिट बढ़ाने की कोई गारंटी नहीं देते. हालांकि, हम आपके अनुरोध की समीक्षा करने की पूरी कोशिश करेंगे.