दर की सीमाएं

रेट लिमिट से यह तय होता है कि तय समय में, Gemini API के लिए कितने अनुरोध किए जा सकते हैं. इन सीमाओं से, सभी उपयोगकर्ताओं के लिए सिस्टम की परफ़ॉर्मेंस को बनाए रखने, गलत इस्तेमाल से बचाने, और सही तरीके से इस्तेमाल करने में मदद मिलती है.

AI Studio में, रेट लिमिट देखें

रेट लिमिट कैसे काम करती हैं

रेट लिमिट को आम तौर पर, तीन डाइमेंशन में मापा जाता है:

  • हर मिनट में किए जा सकने वाले अनुरोधों की संख्या (RPM)
  • हर मिनट में इनपुट किए जा सकने वाले टोकन की संख्या (TPM)
  • हर दिन में किए जा सकने वाले अनुरोधों की संख्या (RPD)

आपके इस्तेमाल का आकलन, हर लिमिट के हिसाब से किया जाता है. इनमें से किसी भी लिमिट से ज़्यादा इस्तेमाल करने पर, रेट लिमिट से जुड़ी गड़बड़ी ट्रिगर हो जाएगी. उदाहरण के लिए, अगर आपकी RPM लिमिट 20 है, तो एक मिनट में 21 अनुरोध करने पर गड़बड़ी होगी. भले ही, आपने अपनी TPM या अन्य लिमिट को पार न किया हो.

रेट लिमिट, हर प्रोजेक्ट पर लागू होती हैं. ये एपीआई कुंजी पर लागू नहीं होतीं. हर दिन किए जा सकने वाले अनुरोधों की संख्या (RPD) का कोटा, पैसिफ़िक टाइम के मुताबिक आधी रात को रीसेट होता है.

लिमिट, इस्तेमाल किए जा रहे मॉडल के हिसाब से अलग-अलग होती हैं. साथ ही, कुछ लिमिट सिर्फ़ चुनिंदा मॉडल पर लागू होती हैं. उदाहरण के लिए, हर मिनट में जनरेट की जा सकने वाली इमेज की संख्या (आईपीएम) की गिनती सिर्फ़ उन मॉडल के लिए की जाती है जो इमेज जनरेट कर सकते हैं. जैसे, Nano Banana. हालांकि, यह कॉन्सेप्ट के हिसाब से टीपीएम के जैसी ही है. अन्य मॉडल के लिए, हर दिन इस्तेमाल किए जा सकने वाले टोकन की संख्या (टीपीडी) की लिमिट हो सकती है.

एक्सपेरिमेंट के तौर पर उपलब्ध और प्रीव्यू के लिए उपलब्ध मॉडल के लिए, रेट लिमिट ज़्यादा पाबंदियों वाली होती हैं.

इस्तेमाल करने से जुड़े टियर

रेट लिमिट, प्रोजेक्ट के इस्तेमाल करने से जुड़े टियर से जुड़ी होती हैं. एपीआई के इस्तेमाल और खर्च में बढ़ोतरी होने पर, आपको ज़्यादा रेट लिमिट वाले अगले टियर में अपने-आप अपग्रेड कर दिया जाएगा.

टियर 2 और 3 के लिए ज़रूरी शर्तें, आपके प्रोजेक्ट से लिंक किए गए बिलिंग खाते के लिए, Google Cloud की सेवाओं (इनमें Gemini API भी शामिल है) पर किए गए कुल खर्च के आधार पर तय की जाती हैं.

इस्तेमाल करने से जुड़ा टियर क्वालिफ़िकेशन राउंड बिलिंग टियर की सीमा
Free चालू प्रोजेक्ट या मुफ़्त में आज़माने की सुविधा लागू नहीं
टियर 1 चालू बिलिंग खाता सेट अप और लिंक करना 250 डॉलर
टियर 2 पहले पेमेंट के बाद 100 डॉलर + 3 दिन 2,000 डॉलर
टियर 3 पहले पेमेंट के बाद 1,000 डॉलर + 30 दिन 20,000 डॉलर - 1,00,000 डॉलर से ज़्यादा

आम तौर पर, बताई गई ज़रूरी शर्तों को पूरा करने पर, मंज़ूरी मिल जाती है. हालांकि, कुछ मामलों में, समीक्षा के दौरान पता चली अन्य वजहों के आधार पर, अपग्रेड के अनुरोध को अस्वीकार किया जा सकता है.

इस सिस्टम से, सभी उपयोगकर्ताओं के लिए Gemini API प्लैटफ़ॉर्म की सुरक्षा और इंटिग्रिटी को बनाए रखने में मदद मिलती है.

Gemini API की रेट लिमिट

रेट लिमिट कई चीज़ों पर निर्भर करती हैं. जैसे, इस्तेमाल करने से जुड़ा आपका टियर. इन्हें Google AI Studio में देखा जा सकता है. समय के साथ-साथ, आपके टियर और खाते के स्टेटस में बदलाव होने पर, रेट लिमिट अपने-आप अपडेट हो जाएंगी.

AI Studio में, रेट लिमिट देखें

बताई गई रेट लिमिट की गारंटी नहीं दी जाती. असल में, क्षमता अलग-अलग हो सकती है.

प्राथमिकता वाले इन्फ़रेंस की रेट लिमिट

प्राथमिकता वाले इन्फ़रेंस की अपनी रेट लिमिट होती हैं. भले ही, इसके इस्तेमाल को इंटरैक्टिव ट्रैफ़िक की कुल रेट लिमिट में गिना जाता हो. डिफ़ॉल्ट रेट लिमिट ये हैं: हर मॉडल और टियर के लिए, स्टैंडर्ड रेट लिमिट का 0.3 गुना

बैच एपीआई की रेट लिमिट

बैच एपीआई के अनुरोधों पर, अपनी रेट लिमिट लागू होती हैं. ये लिमिट, नॉन-बैच एपीआई कॉल से अलग होती हैं.

  • एक साथ किए जा सकने वाले बैच अनुरोध: 100
  • इनपुट फ़ाइल के साइज़ की लिमिट: 2 जीबी
  • फ़ाइल स्टोरेज की लिमिट: 20 जीबी
  • हर मॉडल के लिए, क्यू में शामिल किए जा सकने वाले टोकन की संख्या: बैच में शामिल किए गए टोकन टेबल में, किसी मॉडल के लिए बैच प्रोसेसिंग के लिए, क्यू में शामिल किए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या दिखाई जाती है. यह संख्या, आपके सभी चालू बैच जॉब के लिए होती है.

टियर 1

मॉडल बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 3.1 Pro Preview 50,00,000
Gemini 3.1 Flash-Lite 1,00,00,000
Gemini 3.1 Flash-Lite Preview 1,00,00,000
Gemini 3.5 Flash 30,00,000
Gemini 3.5 Flash 30,00,000
Gemini 2.5 Pro 50,00,000
Gemini 2.5 Pro TTS 25,000
Gemini 2.5 Flash 30,00,000
Gemini 2.5 Flash Preview 30,00,000
Gemini 2.5 Flash Image Preview 30,00,000
Gemini 2.5 Flash TTS 1,00,000
Gemini 2.5 Flash-Lite 1,00,00,000
Gemini 2.5 Flash-Lite Preview 1,00,00,000
Gemini 2.0 Flash 1,00,00,000
Gemini 2.0 Flash Image 30,00,000
Gemini 2.0 Flash-Lite 1,00,00,000
मल्टी-मॉडल जनरेशन मॉडल
Gemini 3.1 Flash Image Preview 🍌 10,00,000
Gemini 3 Pro Image Preview 🍌 20,00,000
एम्बेड करने वाले मॉडल
Gemini Embedding 5,00,000

टियर 2

मॉडल बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 3.1 Pro Preview 50,00,00,000
Gemini 3.1 Flash-Lite 50,00,00,000
Gemini 3.1 Flash-Lite Preview 50,00,00,000
Gemini 3.5 Flash 40,00,00,000
Gemini 3.5 Flash 40,00,00,000
Gemini 2.5 Pro 50,00,00,000
Gemini 2.5 Pro TTS 1,00,000
Gemini 2.5 Flash 40,00,00,000
Gemini 2.5 Flash Preview 40,00,00,000
Gemini 2.5 Flash Image Preview 40,00,00,000
Gemini 2.5 Flash TTS 1,00,000
Gemini 2.5 Flash-Lite 50,00,00,000
Gemini 2.5 Flash-Lite Preview 50,00,00,000
Gemini 2.0 Flash 1,00,00,00,000
Gemini 2.0 Flash Image 40,00,00,000
Gemini 2.0 Flash-Lite 1,00,00,00,000
मल्टी-मॉडल जनरेशन मॉडल
Gemini 3.1 Flash Image Preview 🍌 25,00,00,000
Gemini 3 Pro Image Preview 🍌 27,00,00,000
एम्बेड करने वाले मॉडल
Gemini Embedding 50,00,000

टियर 3

मॉडल बैच में शामिल किए गए टोकन
टेक्स्ट-आउट मॉडल
Gemini 3.1 Pro Preview 1,00,00,00,000
Gemini 3.1 Flash-Lite 1,00,00,00,000
Gemini 3.1 Flash-Lite Preview 1,00,00,00,000
Gemini 3.5 Flash 1,00,00,00,000
Gemini 3.5 Flash 1,00,00,00,000
Gemini 2.5 Pro 1,00,00,00,000
Gemini 2.5 Pro TTS 10,00,000
Gemini 2.5 Flash 1,00,00,00,000
Gemini 2.5 Flash Preview 1,00,00,00,000
Gemini 2.5 Flash Image Preview 1,00,00,00,000
Gemini 2.5 Flash TTS 40,00,000
Gemini 2.5 Flash-Lite 1,00,00,00,000
Gemini 2.5 Flash-Lite Preview 1,00,00,00,000
Gemini 2.0 Flash 5,00,00,00,000
Gemini 2.0 Flash Image 1,00,00,00,000
Gemini 2.0 Flash-Lite 5,00,00,00,00,000
मल्टी-मॉडल जनरेशन मॉडल
Gemini 3.1 Flash Image Preview 🍌 75,00,00,000
Gemini 3 Pro Image Preview 🍌 1,00,00,00,000
एम्बेड करने वाले मॉडल
Gemini Embedding 1,00,00,000

अगले टियर पर अपग्रेड करने का तरीका

फ़्री टियर से किसी ऐसे टियर पर जाने के लिए जिसमें पैसे चुकाने पड़ते हैं, आपको सबसे पहले AI Studio में बिलिंग सेट अप करनी होगी.

जब आपका प्रोजेक्ट, तय की गई ज़रूरी शर्तों को पूरा कर लेगा, तो उसे अगले टियर में अपने-आप अपग्रेड कर दिया जाएगा. फ़्री टियर से टियर 1 में अपग्रेड करने में आम तौर पर तुरंत समय लगता है. इसके बाद के टियर में अपग्रेड करने में 10 मिनट लगेंगे. अपने टियर की जानकारी देखने के लिए, AI Studio में प्रोजेक्ट पेज पर जाएं.

रेट लिमिट बढ़ाने का अनुरोध करना

मॉडल के हर वर्शन के लिए, एक रेट लिमिट (हर मिनट में किए जा सकने वाले अनुरोधों की संख्या, RPM) तय की जाती है. इन रेट लिमिट के बारे में ज़्यादा जानकारी के लिए, AI Studio की रेट लिमिट वाला पेज देखें.

पैसे चुकाकर इस्तेमाल किए जाने वाले टियर की रेट लिमिट बढ़ाने का अनुरोध करना

हम आपकी रेट लिमिट बढ़ाने की कोई गारंटी नहीं देते. हालांकि, हम आपके अनुरोध की समीक्षा करने की पूरी कोशिश करेंगे.