Interactions API अब सामान्य तौर पर उपलब्ध है. हमारा सुझाव है कि सभी नई सुविधाओं और मॉडल का ऐक्सेस पाने के लिए, इस एपीआई का इस्तेमाल करें.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

मॉडल

इस गाइड में, Gemini API के ज़रिए उपलब्ध सभी मॉडल के बारे में बताया गया है.

Gemini 3

स्थिर रुझान

Gemini 3.5 Flash

एजेंटिक और कोडिंग से जुड़े कामों को लगातार बेहतर तरीके से करने के लिए, सबसे बेहतरीन मॉडल.

स्थिर रुझान

Gemini 3.1 Flash-Lite

यह फ़्रंटियर क्लास की परफ़ॉर्मेंस देता है. साथ ही, इसकी लागत बड़े मॉडल की तुलना में काफ़ी कम होती है.

स्थिर रुझान

Nano Banana 2

इमेज जनरेट करने और उनमें बदलाव करने की बेहतरीन सुविधा. इसे तेज़ी से काम करने और ज़्यादा से ज़्यादा इस्तेमाल के लिए ऑप्टिमाइज़ किया गया है.

स्थिर रुझान

Nano Banana 2 Lite

इमेज जनरेट करने और उनमें बदलाव करने के लिए, इंतज़ार का समय बहुत कम रखने और किफ़ायती होने की सुविधा. इसे ज़्यादा इंटरैक्टिव इस्तेमाल के लिए डिज़ाइन किया गया है.

स्थिर रुझान

Nano Banana Pro

इमेज जनरेट करने और उनमें बदलाव करने वाले बेहतरीन मॉडल, ताकि कॉन्टेक्स्ट के हिसाब से नेटिव इमेज बनाई जा सकें.

स्थिर रुझान

झलक देखें

Gemini 3.1 Pro

बेहतरीन एआई, मुश्किल समस्याओं को हल करने की क्षमता, और एजेंटिक और वाइब कोडिंग की बेहतरीन क्षमताएं.

झलक देखें

Gemini 3 Flash

झलक देखें

Gemini 3.5 Live Translate

यह मॉडल, रीयल-टाइम में एक भाषा से दूसरी भाषा में अनुवाद करता है. इसमें कम समय लगता है. यह 70 से ज़्यादा भाषाओं में काम करता है.

नई झलक

Gemini 3.1 Flash Live

रीयल-टाइम में बातचीत करने और बोलकर बातचीत करने वाले एआई ऐप्लिकेशन के लिए, अच्छी क्वालिटी वाला Live API मॉडल. इसमें कम समय में जवाब मिलता है.

नई झलक

Gemini 3.1 Flash TTS

आवाज़ को कम समय में जनरेट करने की सुविधा.

नई झलक

Gemini Omni Flash

बातचीत के ज़रिए तेज़ी से वीडियो जनरेट करने और उनमें बदलाव करने की सुविधा. टेक्स्ट और इमेज को वीडियो में बदलें. साथ ही, नैचुरल लैंग्वेज का इस्तेमाल करके नतीजों को बेहतर बनाएं.

नई झलक

Gemini 2.5 Flash

यह मॉडल, कम इंतज़ार के समय में ज़्यादा काम करने के लिए सबसे अच्छा है. साथ ही, यह कम कीमत में उपलब्ध है. यह ऐसे टास्क के लिए भी अच्छा है जिनमें गहराई से विश्लेषण करने की ज़रूरत होती है.

Nano Banana

इमेज जनरेट करने और एडिटिंग से उन्हें बेहतर बनाने वाला शानदार मॉडल. इसे तेज़ी से काम करने और क्रिएटिव वर्कफ़्लो के लिए डिज़ाइन किया गया है.

Gemini 2.5 Flash Live Preview

इसे रीयल-टाइम में बातचीत करने वाले एजेंट के लिए ऑप्टिमाइज़ किया गया है. इसमें एक सेकंड से भी कम समय में, नेटिव ऑडियो स्ट्रीम किया जा सकता है.

Gemini 2.5 Flash TTS Preview

टेक्स्ट को ऑडियो में बदलने की सुविधा, जिसमें स्टाइल और पेसिंग को कंट्रोल किया जा सकता है.

Gemini 2.5 Flash-Lite

यह 2.5 फ़ैमिली का सबसे तेज़ और किफ़ायती मल्टीमॉडल है.

Gemini 2.5 Pro

यह मुश्किल टास्क पूरे करने के लिए, हमारा सबसे ऐडवांस मॉडल है. इसमें गहराई से सोचने-समझने और कोडिंग करने की क्षमता है.

Gemini 2.5 Pro टीटीएस प्रीव्यू

पॉडकास्ट और ऑडियो बुक जैसे स्ट्रक्चर्ड वर्कफ़्लो में, अच्छी क्वालिटी के लिए ऑप्टिमाइज़ की गई हाई-फ़िडेलिटी स्पीच सिंथेसिस.

ऑडियो मॉडल

इस सेक्शन में सभी ऑडियो मॉडल शामिल हैं. इनमें वे मॉडल भी शामिल हैं जो पहले से ही अन्य सेक्शन में शामिल हो सकते हैं

यह अच्छी क्वालिटी वाला, कम समय में ऑडियो से ऑडियो (A2A) जनरेट करने वाला मॉडल है. इसे रीयल-टाइम में बातचीत करने और एआई के ऐसे ऐप्लिकेशन के लिए डिज़ाइन किया गया है जिनमें आवाज़ का इस्तेमाल मुख्य तौर पर किया जाता है.

Gemini 3.1 Flash TTS Preview

इसमें कम समय में स्पीच जनरेट करने की सुविधा मिलती है. साथ ही, नैचुरल आउटपुट, प्रॉम्प्ट को कंट्रोल करने की सुविधा, और सटीक नैरेशन कंट्रोल के लिए नए एक्सप्रेसिव ऑडियो टैग मिलते हैं.

Gemini 2.5 Flash Live Preview

यह हमारा फ़्लैगशिप Live API मॉडल है. इसमें कम समय में दोनों तरफ़ से आवाज़ और वीडियो एजेंट के साथ बातचीत की जा सकती है. साथ ही, इसमें नेटिव ऑडियो रीज़निंग की सुविधा भी मिलती है.

Gemini 2.5 Flash TTS Preview

कम इंतज़ार के समय, किफ़ायती ऐप्लिकेशन, और रीयल-टाइम में मदद करने वाली सुविधाओं के लिए, लिखाई को बोली में बदलने की सुविधा को तेज़ी से और कंट्रोल किया जा सकता है.

Gemini 2.5 Pro टीटीएस प्रीव्यू

जनरेटिव मीडिया मॉडल

इस सेक्शन में जनरेटिव मीडिया के सभी मॉडल शामिल होते हैं. इनमें वे मॉडल भी शामिल होते हैं जो पहले से ही अन्य सेक्शन में शामिल हो सकते हैं

Nano Banana 2

यह मॉडल, Gemini 3 सीरीज़ की इंटेलिजेंस और तेज़ी से इमेज जनरेट करने की क्षमता को मिलाकर बनाया गया है. इससे, प्रोडक्शन-स्केल पर विज़ुअल को ज़्यादा असरदार तरीके से बनाया जा सकता है.

Nano Banana 2 Lite

इसे इमेज जनरेट करने वाले मॉडल के परिवार में, सबसे ज़्यादा कुशलता से काम करने वाले मॉडल के तौर पर डिज़ाइन किया गया है. यह इंतज़ार का समय बहुत कम रखने से जुड़ी सेटिंग और किफ़ायती इमेज जनरेट करने और उनमें बदलाव करने की सुविधा देता है.

Veo 3.1 Preview

इसमें क्रिएटिव कंट्रोल की ऐडवांस सुविधाओं के साथ-साथ, नेटिव तौर पर सिंक किए गए ऑडियो की मदद से, शानदार वीडियो जनरेट करने की सुविधा मिलती है.

Nano Banana Pro

यह एक प्रोफ़ेशनल डिज़ाइन इंजन है. इसमें स्टूडियो-क्वालिटी वाले 4K विज़ुअल, जटिल लेआउट, और सटीक टेक्स्ट रेंडरिंग के लिए, रीज़निंग कोर मौजूद है.

Veo 3.1 Lite Preview

Veo 3.1 फ़ैमिली के इस मॉडल की मदद से, कम लागत में वीडियो जनरेट किए जा सकते हैं. साथ ही, उनमें बदलाव किया जा सकता है और उन्हें सिनमैटिक कंट्रोल दिया जा सकता है. यह मॉडल, डेवलपर को ध्यान में रखकर बनाया गया है.

Gemini Omni Flash प्रीव्यू

Nano Banana

Imagen 4 अब काम नहीं करता

यह अब तक का सबसे बेहतरीन टेक्स्ट से इमेज जनरेट करने वाला मॉडल है. इसकी मदद से, इमेज को फटाफट और बहुत तेज़ी से जनरेट किया जा सकता है. साथ ही, इमेज को 2K रिज़ॉल्यूशन तक की बेहतरीन क्वालिटी में जनरेट किया जा सकता है.

संगीत जनरेट करने वाले मॉडल

इस सेक्शन में संगीत जनरेट करने की सुविधा वाले सभी मॉडल शामिल हैं. इनमें वे मॉडल भी शामिल हैं जो पहले से ही अन्य सेक्शन में शामिल हो सकते हैं

Lyria 3 Pro Preview

यह संगीत जनरेट करने वाला हमारा फ़्लैगशिप मॉडल है. इसे पूरे गाने जनरेट करने के लिए ऑप्टिमाइज़ किया गया है. इसमें जटिल स्ट्रक्चरल कोहेरेंस होती है.

Lyria 3 Clip Preview

इसे 30 सेकंड तक की छोटी म्यूज़िकल क्लिप, लूप, और प्रीव्यू जनरेट करने के लिए ऑप्टिमाइज़ किया गया है.

Lyria RealTime Experimental

यह हाई-फ़िडेलिटी संगीत जनरेट करने वाला मॉडल है. इसमें विस्तृत क्रिएटिव कंट्रोल की सुविधा मिलती है. साथ ही, रीयल-टाइम में स्ट्रीमिंग की जा सकती है.

टूल और एजेंट मॉडल

कंप्यूटर पर इस्तेमाल करने की झलक

यह एक खास मॉडल है, जो डिजिटल स्क्रीन को "देख" सकता है. साथ ही, यूज़र इंटरफ़ेस (यूआई) से जुड़ी कार्रवाइयां कर सकता है. जैसे, क्लिक करना, टाइप करना, और ब्राउज़र पर मुश्किल टास्क को अपने-आप पूरा करने के लिए नेविगेट करना.

Gemini की Deep Research सुविधा प्रीव्यू

यह एक एजेंटिक मॉडल है. यह सैकड़ों सोर्स से जानकारी इकट्ठा करके, कई चरणों में रिसर्च करने का प्लान अपने-आप बनाता है और उसे लागू करता है. इसके बाद, यह सोर्स के साथ इंटरैक्टिव रिपोर्ट तैयार करता है.

Gemini Deep Research Max Preview

कॉन्टेक्स्ट से जुड़ी जानकारी को अपने-आप इकट्ठा करने और उसे कई सोर्स से मिलाकर तैयार करने की सुविधा.

Antigravity एजेंट झलक

यह एक सामान्य मकसद के लिए मैनेज किया जाने वाला एजेंट है. यह अपने-आप प्लान बनाता है, तर्क देता है, कोड चलाता है, फ़ाइलों को मैनेज करता है, और सुरक्षित, अलग किए गए Linux सैंडबॉक्स में वेब ब्राउज़ करता है.

टास्क के हिसाब से मॉडल

Gemini Embedding 2

यह हमारा पहला मल्टीमॉडल एम्बेडिंग मॉडल है. यह टेक्स्ट, इमेज, वीडियो, ऑडियो, और PDF को एक ही एम्बेडिंग स्पेस में मैप करता है. इससे ऐडवांस सिमेंटिक सर्च और RAG सिस्टम को बेहतर बनाने में मदद मिलती है.

Gemini Embedding

एडवांस सिमैंटिक सर्च, टेक्स्ट क्लासिफ़िकेशन, और RAG सिस्टम के लिए, ज़्यादा डाइमेंशन वाले वेक्टर प्रज़ेंटेशन.

Gemini Robotics-ER 1.6Preview

यह एक अडवांस एम्बॉडिड रीज़निंग मॉडल है. यह फ़िज़िकल स्पेस को समझता है और रोबोटिक एजेंट के लिए कई चरणों वाले टास्क प्लान करता है. इसमें इंस्ट्रुमेंट रीडिंग, बेहतर स्पेशल और फ़िज़िकल रीज़निंग जैसी नई सुविधाएं हैं.

पिछले मॉडल

Gemini 2.0 Flash बंद किया गया

यह हमारा दूसरी जनरेशन का मॉडल है. इसमें अगली जनरेशन की सुविधाएँ और बेहतर क्षमताएँ हैं. जैसे, ज़्यादा तेज़ी से काम करना, नेटिव टूल का इस्तेमाल करना, और 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो.

Gemini 2.0 Flash-Lite बंद किया गया

यह दूसरी जनरेशन का सबसे तेज़ मॉडल है. इसे कम लागत और कम समय में जवाब देने के लिए ऑप्टिमाइज़ किया गया है.

Gemini 3.1 Flash-Lite की झलक बंद कर दी गई है

यह हमारा सबसे किफ़ायती मल्टीमॉडल है. यह ज़्यादा फ़्रीक्वेंसी वाले और हल्के-फुल्के कामों को तेज़ी से पूरा करता है.

Gemini 3 Pro की झलक बंद करें

यह हमारा सबसे नया और बेहतरीन रीज़निंग मॉडल है. इसमें टेक्स्ट, इमेज वगैरह को प्रोसेस करके गहराई से समझने की ऐडवांस सुविधा है.

मॉडल के वर्शन के नाम के पैटर्न

Gemini के मॉडल, स्टेबल, प्रीव्यू, लेटेस्ट या एक्सपेरिमेंट के तौर पर उपलब्ध वर्शन में उपलब्ध होते हैं.

स्थिर रुझान

यह किसी खास स्टेबल मॉडल की ओर ले जाता है. स्टेबल मॉडल में आम तौर पर बदलाव नहीं होता. ज़्यादातर प्रोडक्शन ऐप्लिकेशन को किसी खास स्टेबल मॉडल का इस्तेमाल करना चाहिए.

उदाहरण के लिए: gemini-3.5-flash.

झलक देखें

यह एक ऐसे प्रीव्यू मॉडल की ओर ले जाता है जिसका इस्तेमाल प्रोडक्शन के लिए किया जा सकता है. प्रीव्यू मॉडल के लिए, आम तौर पर बिलिंग की सुविधा चालू होती है. साथ ही, इन पर दर की सीमाएं ज़्यादा पाबंदियों वाली हो सकती हैं. इसके अलावा, इन्हें बंद करने से कम से कम दो हफ़्ते पहले सूचना दी जाएगी.

उदाहरण के लिए: gemini-2.5-flash-preview-09-2025.

सबसे नए

किसी मॉडल के खास वैरिएंट के नए वर्शन की ओर ले जाता है. यह स्टेबल, प्रीव्यू या एक्सपेरिमेंटल रिलीज़ हो सकती है. किसी मॉडल के हर नए वर्शन के रिलीज़ होने पर, यह उपनाम बदल जाएगा. सबसे नए वर्शन से पहले वाले वर्शन को बदलने से पहले, आपको ईमेल से दो हफ़्ते पहले सूचना दी जाएगी.

उदाहरण के लिए: gemini-flash-latest.

एक्सपेरिमेंट के तौर पर उपलब्ध

यह एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल की ओर इशारा करता है. आम तौर पर, यह मॉडल प्रोडक्शन के लिए सही नहीं होता. साथ ही, इसके इस्तेमाल की दर पर ज़्यादा पाबंदियां होती हैं. हम एक्सपेरिमेंट के तौर पर मॉडल रिलीज़ करते हैं, ताकि हमें सुझाव/राय मिल सके और हम डेवलपर को अपने नए अपडेट तुरंत उपलब्ध करा सकें.

एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल स्थिर नहीं होते हैं. साथ ही, मॉडल एंडपॉइंट की उपलब्धता में बदलाव हो सकता है.

मॉडल बंद करना

मॉडल के काम न करने के बारे में जानकारी पाने के लिए, Gemini के काम न करने वाले मॉडल पेज पर जाएं.