दर की सीमाएं

अनुरोधों की दर से जुड़ी सीमाओं से यह तय होता है कि किसी तय समयसीमा में, Gemini API को कितने अनुरोध किए जा सकते हैं. इन सीमाओं से, सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने, गलत इस्तेमाल को रोकने, और उचित इस्तेमाल को बनाए रखने में मदद मिलती है.

AI Studio में, दर से जुड़ी लागू सीमाएं देखना

अनुरोध करने की सीमाएं कैसे काम करती हैं

आम तौर पर, दर की सीमाओं को तीन डाइमेंशन के हिसाब से मापा जाता है:

  • हर मिनट में किए गए अनुरोधों की संख्या (आरपीएम)
  • हर मिनट इस्तेमाल किए जाने वाले टोकन (इनपुट) (टीपीएम)
  • हर दिन के हिसाब से अनुरोध (RPD)

आपके इस्तेमाल का आकलन हर सीमा के हिसाब से किया जाता है. किसी भी सीमा से ज़्यादा इस्तेमाल करने पर, दर की सीमा से जुड़ी गड़बड़ी ट्रिगर होगी. उदाहरण के लिए, अगर आपकी आरपीएम सीमा 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने टीपीएम या अन्य सीमाओं का उल्लंघन न किया हो.

दर सीमाएं, हर प्रोजेक्ट पर लागू होती हैं, न कि हर एपीआई कुंजी पर. हर दिन के अनुरोध (RPD) का कोटा, पैसिफ़िक टाइम के मुताबिक आधी रात को रीसेट होता है.

इस्तेमाल की सीमाएं, इस्तेमाल किए जा रहे मॉडल के हिसाब से अलग-अलग होती हैं. साथ ही, कुछ सीमाएं सिर्फ़ चुनिंदा मॉडल पर लागू होती हैं. उदाहरण के लिए, इमेज प्रति मिनट या आईपीएम की गिनती सिर्फ़ इमेज जनरेट करने वाले मॉडल (Nano Banana) के लिए की जाती है. हालांकि, यह टीपीएम से मिलता-जुलता है. अन्य मॉडल के लिए, हर दिन इस्तेमाल किए जा सकने वाले टोकन की सीमा (टीपीडी) तय की जा सकती है.

एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल और झलक वाले मॉडल के लिए, अनुरोध करने की सीमाएं ज़्यादा प्रतिबंधित होती हैं.

खर्च के आधार पर तय की गई दर की सीमाएं

Gemini API, एक मिनट में किए जा सकने वाले अनुरोधों (आरपीएम) और एक मिनट में इस्तेमाल किए जा सकने वाले टोकन (टीपीएम) की सीमाओं के अलावा, खर्च के आधार पर दर की सीमाएं भी लागू करता है. इससे, उपयोगकर्ताओं को अनचाहे शुल्क से बचाया जा सकता है. ये सीमाएं आपके खाते पर लागू होंगी या नहीं, यह आपकी बिलिंग के इतिहास और इस्तेमाल के टियर पर निर्भर करता है.

यहां दी गई टेबल में, हर इस्तेमाल के टियर के लिए, खर्च के आधार पर तय की गई दर की सीमाएं दिखाई गई हैं. इन सीमाओं का आकलन, 10 मिनट की रोलिंग विंडो के आधार पर किया जाता है. ये सीमाएं आपके खाते पर लागू होती हैं या नहीं, यह आपके बिलिंग इतिहास और खाते की स्थिति पर निर्भर करता है.

इस्तेमाल का टियर खर्च करने की दर की सीमा (हर 10 मिनट में)
Free लागू नहीं
टियर 1 $10
टियर 2 200 डॉलर
टियर 3 200 डॉलर

खर्च के आधार पर तय की गई सीमा पूरी होने पर, एपीआई 429 RESOURCE_EXHAUSTED गड़बड़ी का मैसेज दिखाता है. इस समस्या को हल करने के लिए:

  • कुछ समय बाद, इंतज़ार करें और फिर से कोशिश करें.
  • ज़्यादा कीमत वाले अनुरोधों की दर कम करें. उदाहरण के लिए, छोटी कॉन्टेक्स्ट विंडो या छोटे आउटपुट का इस्तेमाल करें.
  • अगर आपको सामान्य इस्तेमाल के दौरान लगातार इस सीमा का सामना करना पड़ता है, तो दर की सीमा बढ़ाने का अनुरोध करें.

इस्तेमाल के टियर

दर से जुड़ी सीमाएं, प्रोजेक्ट के इस्तेमाल के टियर से जुड़ी होती हैं. एपीआई का इस्तेमाल और खर्च बढ़ने पर, आपको अपने-आप अपग्रेड करके ज़्यादा दर सीमा वाला बेहतर टियर मिल जाएगा.

दूसरे और तीसरे टियर के लिए ज़रूरी शर्तें, Google Cloud की सेवाओं (इसमें Gemini API भी शामिल है) पर किए गए कुल खर्च के आधार पर तय की जाती हैं. यह खर्च, आपके प्रोजेक्ट से लिंक किए गए बिलिंग खाते से किया गया होना चाहिए.

इस्तेमाल का टियर क्वालिफ़िकेशन राउंड बिलिंग टियर कैप
Free चालू प्रोजेक्ट या बिना किसी शुल्क के आज़माने की सुविधा लागू नहीं
टियर 1 चालू बिलिंग खाता सेट अप करना और उसे लिंक करना 250 डॉलर
टियर 2 पहली बार पेमेंट पूरा होने के तीन दिन बाद, 100 डॉलर का पेमेंट किया गया 2,000 डॉलर
टियर 3 पहली बार पेमेंट पूरा होने के 30 दिन बाद, 1,000 डॉलर का पेमेंट किया गया 20,000 से 1,00,000 डॉलर से ज़्यादा

आम तौर पर, ज़रूरी शर्तें पूरी करने पर ही अपग्रेड करने का अनुरोध स्वीकार कर लिया जाता है. हालांकि, कुछ मामलों में समीक्षा के दौरान मिले अन्य तथ्यों के आधार पर, अपग्रेड करने का अनुरोध अस्वीकार किया जा सकता है.

यह सिस्टम, सभी उपयोगकर्ताओं के लिए Gemini API प्लैटफ़ॉर्म की सुरक्षा और अखंडता बनाए रखने में मदद करता है.

Gemini API के लिए अनुरोध करने की सीमाएँ

दर की सीमाएं कई बातों पर निर्भर करती हैं. जैसे, इस्तेमाल का टियर. इन्हें Google AI Studio में देखा जा सकता है. समय के साथ-साथ, आपके टियर और खाते की स्थिति में बदलाव होता रहता है. इसलिए, दर की सीमाएं अपने-आप अपडेट हो जाएंगी.

AI Studio में, दर से जुड़ी लागू सीमाएं देखना

तय की गई दर की सीमाओं की गारंटी नहीं दी जाती. साथ ही, असल क्षमता अलग-अलग हो सकती है.

प्राथमिकता का अनुमान लगाने के लिए, अनुरोधों की तय सीमाएं

प्राथमिकता के आधार पर इस्तेमाल किए जाने वाले संसाधनों के लिए, दर की अपनी सीमाएं होती हैं. भले ही, इस्तेमाल को इंटरैक्टिव ट्रैफ़िक की दर की कुल सीमाओं में गिना जाता हो. डिफ़ॉल्ट रेट लिमिट ये हैं: हर मॉडल और टियर के लिए, स्टैंडर्ड रेट लिमिट का 0.3 गुना

बैच एपीआई के इस्तेमाल की दर से जुड़ी सीमाएं

Batch API अनुरोधों के लिए, दर की सीमाएं अलग से तय की जाती हैं. ये सीमाएं, नॉन-बैच एपीआई कॉल से अलग होती हैं.

  • एक साथ किए गए बैच अनुरोध: 100
  • इनपुट फ़ाइल का साइज़: 2 जीबी
  • फ़ाइल स्टोरेज की सीमा: 20 जीबी
  • हर मॉडल के लिए, लाइन में लगे टोकन: बैच में लाइन में लगे टोकन टेबल में, किसी मॉडल के लिए बैच प्रोसेसिंग के लिए लाइन में लगाए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या दी गई होती है. यह संख्या, बैच प्रोसेसिंग के लिए चालू किए गए सभी जॉब के लिए होती है.

टियर 1

मॉडल बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 3.1 Pro की झलक 5,000,000
Gemini 3.1 Flash-Lite 10,000,000
Gemini 3.1 Flash-Lite की झलक 10,000,000
Gemini 3.5 Flash 30,00,000
Gemini 3.5 Flash 30,00,000
Gemini 2.5 Pro 5,000,000
Gemini 2.5 Pro TTS 25,000
Gemini 2.5 Flash 30,00,000
Gemini 2.5 Flash का प्रीव्यू 30,00,000
Gemini 2.5 Flash की इमेज का प्रीव्यू 30,00,000
Gemini 2.5 Flash TTS 1,00,000
Gemini 2.5 Flash-Lite 10,000,000
Gemini 2.5 Flash-Lite का प्रीव्यू 10,000,000
Gemini 2.0 Flash 10,000,000
Gemini 2.0 Flash Image 30,00,000
Gemini 2.0 Flash-Lite 10,000,000
मल्टी-मोडल जनरेशन मॉडल
Gemini 3.1 Flash की इमेज का प्रीव्यू 🍌 1,000,000
Gemini 3 Pro की इमेज की झलक 🍌 2,000,000
मॉडल एम्बेड करना
Gemini Embedding 500,000

टियर 2

मॉडल बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 3.1 Pro की झलक 500,000,000
Gemini 3.1 Flash-Lite 500,000,000
Gemini 3.1 Flash-Lite की झलक 500,000,000
Gemini 3.5 Flash 400,000,000
Gemini 3.5 Flash 400,000,000
Gemini 2.5 Pro 500,000,000
Gemini 2.5 Pro TTS 1,00,000
Gemini 2.5 Flash 400,000,000
Gemini 2.5 Flash का प्रीव्यू 400,000,000
Gemini 2.5 Flash की इमेज का प्रीव्यू 400,000,000
Gemini 2.5 Flash TTS 1,00,000
Gemini 2.5 Flash-Lite 500,000,000
Gemini 2.5 Flash-Lite का प्रीव्यू 500,000,000
Gemini 2.0 Flash 1,000,000,000
Gemini 2.0 Flash Image 400,000,000
Gemini 2.0 Flash-Lite 1,000,000,000
मल्टी-मोडल जनरेशन मॉडल
Gemini 3.1 Flash की इमेज का प्रीव्यू 🍌 25,00,00,000
Gemini 3 Pro की इमेज की झलक 🍌 27 करोड़
मॉडल एम्बेड करना
Gemini Embedding 5,000,000

टियर 3

मॉडल बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 3.1 Pro की झलक 1,000,000,000
Gemini 3.1 Flash-Lite 1,000,000,000
Gemini 3.1 Flash-Lite की झलक 1,000,000,000
Gemini 3.5 Flash 1,000,000,000
Gemini 3.5 Flash 1,000,000,000
Gemini 2.5 Pro 1,000,000,000
Gemini 2.5 Pro TTS 1,000,000
Gemini 2.5 Flash 1,000,000,000
Gemini 2.5 Flash का प्रीव्यू 1,000,000,000
Gemini 2.5 Flash की इमेज का प्रीव्यू 1,000,000,000
Gemini 2.5 Flash TTS 40,00,000
Gemini 2.5 Flash-Lite 1,000,000,000
Gemini 2.5 Flash-Lite का प्रीव्यू 1,000,000,000
Gemini 2.0 Flash 5,000,000,000
Gemini 2.0 Flash Image 1,000,000,000
Gemini 2.0 Flash-Lite 5,000,000,000
मल्टी-मोडल जनरेशन मॉडल
Gemini 3.1 Flash की इमेज का प्रीव्यू 🍌 750,000,000
Gemini 3 Pro की इमेज की झलक 🍌 1,000,000,000
मॉडल एम्बेड करना
Gemini Embedding 10,000,000

अगले टियर पर अपग्रेड करने का तरीका

मुफ़्त टियर से पैसे चुकाकर ली जाने वाली सदस्यता पर स्विच करने के लिए, आपको सबसे पहले AI Studio में बिलिंग सेट अप करनी होगी.

जब आपका प्रोजेक्ट तय की गई शर्तों को पूरा कर लेगा, तब उसे अगले टियर में अपने-आप अपग्रेड कर दिया जाएगा. मुफ़्त टियर से टियर 1 में अपग्रेड करने पर, आम तौर पर बदलाव तुरंत लागू हो जाते हैं. इसके बाद, टियर अपग्रेड करने पर बदलाव 10 मिनट के अंदर लागू हो जाते हैं. अपने टियर देखने के लिए, AI Studio में प्रोजेक्ट पेज पर जाएं.

अनुरोधों की संख्या बढ़ाने का अनुरोध करना

मॉडल के हर वर्शन के लिए, दर की सीमा (हर मिनट में अनुरोध, आरपीएम) तय की जाती है. इन रेट लिमिट के बारे में जानने के लिए, AI Studio की रेट लिमिट पेज पर जाएं.

पैसे चुकाकर ली जाने वाली सदस्यता के लिए, अनुरोधों की संख्या बढ़ाने का अनुरोध करना

हम दर की सीमा बढ़ाने की कोई गारंटी नहीं देते, लेकिन हम आपके अनुरोध की समीक्षा करने की पूरी कोशिश करेंगे.