Gemini मॉडल

मॉडल के वैरिएंट

Gemini API, अलग-अलग मॉडल उपलब्ध कराता है. ये मॉडल, इस्तेमाल के खास उदाहरणों के लिए ऑप्टिमाइज़ किए जाते हैं. Gemini के उपलब्ध वैरिएंट के बारे में खास जानकारी यहां दी गई है:

मॉडल का वैरिएंट इनपुट आउटपुट इनके लिए ऑप्टिमाइज़ किया गया
Gemini 2.0 Flash
gemini-2.0-flash
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट, इमेज (जल्द आ रही हैं), और ऑडियो (जल्द आ रहा है) अलग-अलग तरह के टास्क के लिए, अगली पीढ़ी की सुविधाएं, तेज़ी, और अलग-अलग मोड में जनरेट करने की सुविधा
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट Gemini 2.0 Flash मॉडल, जिसे कम लागत और कम इंतज़ार के लिए ऑप्टिमाइज़ किया गया है
Gemini 1.5 Flash
gemini-1.5-flash
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर परफ़ॉर्मेंस
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट ज़्यादा संख्या में और कम बुद्धिमत्ता वाले टास्क
Gemini 1.5 Pro
gemini-1.5-pro
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट ऐसे जटिल काम जिनमें ज़्यादा बुद्धिमत्ता की ज़रूरत होती है
टेक्स्ट एम्बेड करना
text-embedding-004
टेक्स्ट टेक्स्ट एम्बेड करना टेक्स्ट स्ट्रिंग की आपस में मिलती-जुलती होने की डिग्री का आकलन करना

किराया तय करने की सीमाओं वाले पेज पर, हर मॉडल के लिए किराया तय करने की सीमाएं देखी जा सकती हैं.

Gemini 2.0 Flash, अगली पीढ़ी की सुविधाओं और बेहतर सुविधाओं के साथ काम करता है. जैसे, बेहतर स्पीड, नेटिव टूल का इस्तेमाल, मल्टी-मोडल जनरेशन, और 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो.

Google AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-2.0-flash
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

ऑडियो (जल्द ही उपलब्ध होगा), इमेज (जल्द ही उपलब्ध होगी), और टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

1,048,576

आउटपुट टोकन की सीमा

8,192

की सुविधाएं

स्ट्रक्चर्ड आउटपुट

काम करता है

कैश मेमोरी में सेव होना

जल्द आ रहा है

ट्यून करना

काम नहीं करता है

फ़ंक्शन कॉलिंग

काम करता है

कोड चलाना

काम करता है

खोजें

काम करता है

इमेज जनरेट करना

जल्द आ रहा है

नेटिव टूल का इस्तेमाल करना

काम करता है

ऑडियो जनरेट करना

जल्द आ रहा है

मल्टीमोडल लाइव एपीआई

जल्द आ रहा है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
  • नया: gemini-2.0-flash
  • स्थिर: gemini-2.0-flash-001
का नया अपडेट फ़रवरी 2025
नॉलेज कटऑफ़ अगस्त 2024

Gemini 2.0 Flash मॉडल, जिसे कम लागत और कम इंतज़ार के लिए ऑप्टिमाइज़ किया गया है.

Google AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-2.0-flash-lite
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

1,048,576

आउटपुट टोकन की सीमा

8,192

की सुविधाएं

स्ट्रक्चर्ड आउटपुट

काम करता है

कैश मेमोरी में सेव होना

काम नहीं करता है

ट्यून करना

काम नहीं करता है

फ़ंक्शन कॉलिंग

काम नहीं करता है

कोड चलाना

काम नहीं करता है

खोजें

काम नहीं करता है

इमेज जनरेट करना

काम नहीं करता है

नेटिव टूल का इस्तेमाल करना

काम नहीं करता है

ऑडियो जनरेट करना

काम नहीं करता है

मल्टीमोडल लाइव एपीआई

काम नहीं करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
  • नया: gemini-2.0-flash-lite
  • स्थिर: gemini-2.0-flash-lite-001
का नया अपडेट फ़रवरी 2025
नॉलेज कटऑफ़ अगस्त 2024

Gemini 1.5 Flash, अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर मल्टीमोडल मॉडल है.

Google AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.5-flash
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

1,048,576

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की खास जानकारी

हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या

3,600

वीडियो की ज़्यादा से ज़्यादा अवधि

1 घंटा

ऑडियो की ज़्यादा से ज़्यादा अवधि

करीब 9.5 घंटे

की सुविधाएं

सिस्टम से जुड़े निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम करता है

सुरक्षा सेटिंग में बदलाव करना

काम करता है

कैश मेमोरी में सेव होना

काम करता है

ट्यून करना

काम करता है

फ़ंक्शन कॉलिंग

काम करता है

कोड चलाना

काम करता है

दोतरफ़ा स्ट्रीमिंग

काम नहीं करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
  • नया: gemini-1.5-flash-latest
  • सबसे नया स्टेबल वर्शन: gemini-1.5-flash
  • स्थिर:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
का नया अपडेट सितंबर 2024

Gemini 1.5 Flash-8B एक छोटा मॉडल है, जिसे कम बुद्धि वाले टास्क के लिए डिज़ाइन किया गया है.

Google AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.5-flash-8b
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

1,048,576

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की खास जानकारी

हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या

3,600

वीडियो की ज़्यादा से ज़्यादा अवधि

1 घंटा

ऑडियो की ज़्यादा से ज़्यादा अवधि

करीब 9.5 घंटे

की सुविधाएं

सिस्टम से जुड़े निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम करता है

सुरक्षा सेटिंग में बदलाव करना

काम करता है

कैश मेमोरी में सेव होना

काम करता है

ट्यून करना

काम करता है

फ़ंक्शन कॉलिंग

काम करता है

कोड चलाना

काम करता है

दोतरफ़ा स्ट्रीमिंग

काम नहीं करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
  • नया: gemini-1.5-flash-8b-latest
  • सबसे नया स्टेबल वर्शन: gemini-1.5-flash-8b
  • स्थिर:
    • gemini-1.5-flash-8b-001
का नया अपडेट अक्टूबर 2024

Gemini 2.0 Pro Experimental आज़माएं. यह अब तक का सबसे बेहतर Gemini मॉडल है.

Gemini 1.5 Pro, एक मिड-साइज़ वाला मल्टीमोडल मॉडल है. इसे कई तरह के तर्क वाले टास्क के लिए ऑप्टिमाइज़ किया गया है. 1.5 Pro, एक साथ बहुत ज़्यादा डेटा प्रोसेस कर सकता है. जैसे, दो घंटे का वीडियो, 19 घंटे का ऑडियो, 60 हज़ार लाइनों वाला कोडबेस या 2,000 पेजों का टेक्स्ट.

Google AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.5-pro
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,097,152

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की खास जानकारी

हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या

7,200

वीडियो की ज़्यादा से ज़्यादा अवधि

2 घंटे

ऑडियो की ज़्यादा से ज़्यादा अवधि

करीब 19 घंटे

की सुविधाएं

सिस्टम से जुड़े निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम करता है

सुरक्षा सेटिंग में बदलाव करना

काम करता है

कैश मेमोरी में सेव होना

काम करता है

ट्यून करना

काम नहीं करता है

फ़ंक्शन कॉलिंग

काम करता है

कोड चलाना

काम करता है

दोतरफ़ा स्ट्रीमिंग

काम नहीं करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
  • नया: gemini-1.5-pro-latest
  • सबसे नया स्टेबल वर्शन: gemini-1.5-pro
  • स्थिर:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
का नया अपडेट सितंबर 2024

टेक्स्ट एम्बेड करना

एक्सपेरिमेंट के तौर पर उपलब्ध Gemini का एम्बेडिंग मॉडल आज़माएं. यह मॉडल, बेहतरीन परफ़ॉर्मेंस देता है.

टेक्स्ट एम्बेड का इस्तेमाल, स्ट्रिंग के बीच के संबंध को मेज़र करने के लिए किया जाता है. साथ ही, इनका इस्तेमाल कई एआई ऐप्लिकेशन में भी किया जाता है.

text-embedding-004, स्टैंडर्ड MTEB एम्बेडिंग मानदंडों पर, तुलना किए जा सकने वाले डाइमेंशन के साथ बेहतर तरीके से जानकारी को वापस लाता है और मौजूदा मॉडल की तुलना में बेहतर परफ़ॉर्म करता है.

मॉडल का विवरण
प्रॉपर्टी ब्यौरा
मॉडल कोड

Gemini API

models/text-embedding-004

के साथ काम करने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट एम्बेड करना

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,048

आउटपुट डाइमेंशन का साइज़

768

रेट की सीमाएं[**] हर मिनट 1,500 अनुरोध
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है काम नहीं करता है
का नया अपडेट अप्रैल 2024

एम्बेड करना

इनपुट टेक्स्ट के लिए, टेक्स्ट एम्बेड जनरेट करने के लिए, एम्बेड मॉडल का इस्तेमाल किया जा सकता है.

एम्बेडिंग मॉडल को 2,048 टोकन तक के टेक्स्ट के लिए, 768 डाइमेंशन वाले एम्बेड बनाने के लिए ऑप्टिमाइज़ किया गया है.

मॉडल की जानकारी एम्बेड करना
प्रॉपर्टी ब्यौरा
मॉडल कोड models/embedding-001
के साथ काम करने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट एम्बेड करना

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,048

आउटपुट डाइमेंशन का साइज़

768

रेट की सीमाएं[**] हर मिनट 1,500 अनुरोध
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है काम नहीं करता है
का नया अपडेट दिसंबर 2023

किसी दस्तावेज़, कॉर्पस या पैसेज के सेट पर, एट्रिब्यूट किए गए सवाल-जवाब (AQA) से जुड़े टास्क करने के लिए, AQA मॉडल का इस्तेमाल किया जा सकता है. AQA मॉडल, दिए गए सोर्स के आधार पर सवालों के जवाब देता है. साथ ही, जवाब मिलने की संभावना का अनुमान भी लगाता है.

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/aqa
के साथ काम करने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट

इस्तेमाल की जा सकने वाली भाषा अंग्रेज़ी
टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

7,168

आउटपुट टोकन की सीमा

1,024

रेट की सीमाएं[**] हर मिनट 1,500 अनुरोध
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है काम करता है
का नया अपडेट दिसंबर 2023

मॉडल के इन वैरिएशन की सुविधाओं के बारे में जानने के लिए, उदाहरण देखें.

[*] Gemini मॉडल के लिए, एक टोकन चार वर्णों के बराबर होता है. 100 टोकन, अंग्रेज़ी के करीब 60 से 80 शब्दों के बराबर होते हैं.

मॉडल के वर्शन के नाम के पैटर्न

Gemini मॉडल, झलक या स्टैबल वर्शन में उपलब्ध हैं. अपने कोड में, मॉडल के नाम के इनमें से किसी एक फ़ॉर्मैट का इस्तेमाल करके यह बताया जा सकता है कि आपको किस मॉडल और वर्शन का इस्तेमाल करना है.

  • नया वर्शन: यह किसी खास जनरेशन और वैरिएशन के लिए, मॉडल के सबसे नए वर्शन को दिखाता है. मॉडल को नियमित तौर पर अपडेट किया जाता है. यह झलक वाला वर्शन हो सकता है. सिर्फ़ एक्सप्लोरेटिव टेस्टिंग ऐप्लिकेशन और प्रोटोटाइप के लिए, इस उपनाम का इस्तेमाल किया जाना चाहिए.

    सबसे नए वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-latest. उदाहरण के लिए, gemini-1.0-pro-latest.

  • सबसे नया स्टेबल वर्शन: यह किसी मॉडल जनरेशन और वैरिएशन के लिए रिलीज़ किए गए सबसे नए स्टेबल वर्शन की जानकारी देता है.

    सबसे नए स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>. उदाहरण के लिए, gemini-1.0-pro.

  • स्टैबल: किसी खास स्टैबल मॉडल की जानकारी देता है. स्टेबल मॉडल में बदलाव नहीं होता. ज़्यादातर प्रोडक्शन ऐप्लिकेशन को किसी खास स्टेबल मॉडल का इस्तेमाल करना चाहिए.

    स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-<version>. उदाहरण के लिए, gemini-1.0-pro-001.

  • एक्सपेरिमेंट के तौर पर उपलब्ध: शर्तों में बताए गए मुताबिक, यह झलक में उपलब्ध एक्सपेरिमेंटल मॉडल की जानकारी देता है. इसका मतलब है कि इसे प्रोडक्शन में इस्तेमाल नहीं किया जा सकता. हम एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल रिलीज़ करते हैं, ताकि हमें सुझाव, राय या शिकायत मिल सके. साथ ही, डेवलपर को हमारे नए अपडेट जल्दी मिल सकें और Google में हो रहे इनोवेशन के बारे में जानकारी मिल सके. एक्सपेरिमेंट के तौर पर लॉन्च करने से, हमें यह जानकारी मिलती है कि मॉडल को सभी लोगों के लिए कैसे उपलब्ध कराया जा सकता है. एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल को, बिना किसी सूचना के किसी दूसरे मॉडल से बदला जा सकता है. हम इस बात की गारंटी नहीं देते कि एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल, आने वाले समय में स्थिर मॉडल बन जाएगा.

    एक्सपेरिमेंट के लिए बने वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-<version>. उदाहरण के लिए, gemini-2.0-pro-exp-02-05.

    डेवलपमेंट और टेस्टिंग को आसान बनाने के लिए, वर्शन को हटाया जा सकता है और सिर्फ़ -exp का इस्तेमाल किया जा सकता है. उदाहरण के लिए, gemini-2.0-pro-exp. यह हमेशा, एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल के सबसे नए वर्शन का रेफ़रंस देता है.

उपलब्ध भाषाएं

Gemini मॉडल को इन भाषाओं के साथ काम करने के लिए ट्रेन किया गया है:

  • ऐरेबिक (ar)
  • बांग्ला (bn)
  • बुल्गेरियन (bg)
  • चाइनीज़ सिम्प्लिफ़ाइड और ट्रेडिशनल (zh)
  • क्रोएशियन (hr)
  • चेक (cs)
  • डेनिश (da)
  • डच (nl)
  • अंग्रेज़ी (en)
  • एस्टोनियन (et)
  • फ़िनिश (fi)
  • फ़्रेंच (fr)
  • जर्मन (de)
  • ग्रीक (el)
  • हिब्रू (iw)
  • हिन्दी (hi)
  • हंगेरियन (hu)
  • इंडोनेशियन (id)
  • इटैलियन (it)
  • जैपनीज़ (ja)
  • कोरियन (ko)
  • लैटवियन (lv)
  • लिथुएनियन (lt)
  • नॉर्वीजन (no)
  • पोलिश (pl)
  • पॉर्चुगीज़ (pt)
  • रोमेनियन (ro)
  • रशियन (ru)
  • सर्बियाई (sr)
  • स्लोवाक (sk)
  • स्लोवेनियन (sl)
  • स्पैनिश (es)
  • स्वाहिली (sw)
  • स्वीडिश (sv)
  • थाई (th)
  • तुर्किश (tr)
  • यूक्रेनियन (uk)
  • वियतनामीज़ (vi)