Gemini के मॉडल

मॉडल के वैरिएंट

Gemini API के अलग-अलग मॉडल उपलब्ध हैं. इन्हें चुनिंदा कामों के लिए ऑप्टिमाइज़ किया गया है मामले. Gemini के उपलब्ध वैरिएंट के बारे में खास जानकारी यहां दी गई है:

मॉडल का वैरिएंट इनपुट आउटपुट इसके लिए ऑप्टिमाइज़ किया गया
Gemini 1.5 Flash
gemini-1.5-flash
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट कई तरह के टास्क के लिए तेज़ और शानदार परफ़ॉर्मेंस
Gemini 1.5 Pro
gemini-1.5-pro
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट रीज़निंग से जुड़े जटिल टास्क, जैसे कि कोड और टेक्स्ट जनरेट करना, टेक्स्ट एडिटिंग, समस्या हल करना, डेटा निकालना, और जनरेशन
Gemini 1.0 Pro
gemini-1.0-pro
टेक्स्ट टेक्स्ट सामान्य भाषा से जुड़े टास्क, बार-बार आने वाले टेक्स्ट, कोड चैट, और कोड जनरेशन
टेक्स्ट एम्बेड करना
text-embedding-004
टेक्स्ट टेक्स्ट एम्बेड करना टेक्स्ट स्ट्रिंग के बीच संबंध का पता लगाना
AQA
aqa
टेक्स्ट टेक्स्ट सवालों के सोर्स के आधार पर जवाब देना

नीचे दी गई टेबल में, Gemini के इन मॉडल के एट्रिब्यूट के बारे में बताया गया है यह मॉडल के सभी वैरिएंट के लिए एक जैसा होता है:

एट्रिब्यूट ब्यौरा
ट्रेनिंग का डेटा Gemini का नॉलेज कटऑफ़ समय नवंबर 2023 है. उस समय के बाद के इवेंट के बारे में सीमित जानकारी होती है.
इस्तेमाल की जा सकने वाली भाषाएं उपलब्ध भाषाएं देखें
कॉन्फ़िगर किए जा सकने वाले मॉडल पैरामीटर
  • सबसे ऊपर p
  • टॉप के
  • तापमान
  • स्टॉप का क्रम
  • आउटपुट की ज़्यादा से ज़्यादा लंबाई
  • जवाब देने वाले उम्मीदवारों की संख्या

मॉडल पैरामीटर देखें सेक्शन में, इनमें से हर पैरामीटर के बारे में जानकारी के लिए, जनरेटिव मॉडल गाइड पढ़ें.

Gemini 1.5 फ़्लैश

Gemini 1.5 Flash, तेज़ और कई तरह से काम करने वाला मल्टीमोडल मॉडल है. इसकी मदद से, स्केल को बड़ा किया जा सकता है अलग-अलग तरह के टास्क पूरे करने में मदद मिलती है.

AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.5-flash
इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

10,48,576

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की जानकारी

हर प्रॉम्प्ट में ज़्यादा से ज़्यादा इमेज शामिल करने की संख्या

3,600

वीडियो कितना लंबा होना चाहिए

1 घंटा

ऑडियो कितना लंबा हो सकता है

करीब 9.5 घंटे

रेट की सीमा[**]
मुफ़्त:
  • 15 आरपीएम
  • 10 लाख टीपीएम
  • 1,500 आरपीडी
Pay-as-you-go:
  • 1,000 आरपीएम
  • 40 लाख टीपीएम
Capabilities

सिस्टम के लिए निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम करता है

सुरक्षा में बदलाव करने की सेटिंग

काम करता है

कैश मेमोरी में सेव होना

काम करता है

ट्यूनिंग

काम करता है

फ़ंक्शन कॉलिंग

काम करता है

फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन

काम करता है

कोड लागू करना

काम करता है

वर्शन
नया अपडेट मई 2024

Gemini 1.5 Pro

Gemini 1.5 Pro, मिड-साइज़ का एक मल्टीमॉडल मॉडल है. इसे रीज़निंग से जुड़े कई तरह के टास्क किए जा सकते हैं. 1.5 Pro बहुत ज़्यादा डेटा को प्रोसेस कर सकता है एक बार में, 2 घंटे के वीडियो, 19 घंटे के ऑडियो, और ऐसे कोड बेस के साथ जिनमें कोड की 60,000 लाइनें या टेक्स्ट के 2,000 पेज.

AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.5-pro
इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

20,97,152

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की जानकारी

हर प्रॉम्प्ट में ज़्यादा से ज़्यादा इमेज शामिल करने की संख्या

7,200

वीडियो कितना लंबा होना चाहिए

2 घंटे

ऑडियो कितना लंबा हो सकता है

करीब 19 घंटे

रेट की सीमा[**]
मुफ़्त:
  • 2 आरपीएम
  • 32,000 टीपीएम
  • 50 आरपीडी
Pay-as-you-go:
  • 360 आरपीएम
  • 40 लाख टीपीएम
Capabilities

सिस्टम के लिए निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम करता है

सुरक्षा में बदलाव करने की सेटिंग

काम करता है

कैश मेमोरी में सेव होना

काम करता है

ट्यूनिंग

काम नहीं करता है

फ़ंक्शन कॉलिंग

काम करता है

फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन

काम करता है

कोड लागू करना

काम करता है

वर्शन
नया अपडेट मई 2024

Gemini 1.0 Pro

Gemini 1.0 Pro एक एनएलपी मॉडल है. यह एक साथ कई काम करने वाले टेक्स्ट और कोड चैट, और कोड जनरेशन.

AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.0-pro
इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट

रेट की सीमा[**]
मुफ़्त:
  • 15 आरपीएम
  • 32,000 टीपीएम
  • 1,500 आरपीडी
Pay-as-you-go:
  • 360 आरपीएम
  • 1,20,000 टीपीएम
  • 30,000 आरपीडी
Capabilities

सिस्टम के लिए निर्देश

काम नहीं करता है

JSON मोड

काम नहीं करता है

JSON स्कीमा

काम नहीं करता है

सुरक्षा में बदलाव करने की सेटिंग

काम करता है

कैश मेमोरी में सेव होना

काम नहीं करता है

ट्यूनिंग

काम करता है

फ़ंक्शन कॉलिंग

काम करता है

फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन

काम नहीं करता है

कोड लागू करना

काम नहीं करता है

वर्शन
  • नई रिलीज़: gemini-1.0-pro-latest
  • हाल ही की स्टेबल चैनल: gemini-1.0-pro
  • स्थिर: gemini-1.0-pro-001
नया अपडेट फ़रवरी 2024

टेक्स्ट एम्बेड और एम्बेड करना

लेख एम्बेड करना

टेक्स्ट एम्बेड करने का इस्तेमाल, स्ट्रिंग की मिलती-जुलती स्थिति का पता लगाने के लिए किया जाता है. साथ ही, इनका इस्तेमाल, कई तरह के एआई ऐप्लिकेशन हैं.

text-embedding-004, फिर से हासिल करने पर बेहतर परफ़ॉर्मेंस देता है और मौजूदा मॉडल से बेहतर परफ़ॉर्म करता है में, एम्बेड किए जा रहे स्टैंडर्ड MTEB के मानदंडों के हिसाब से तुलना की जा सकती है.

मॉडल का विवरण
प्रॉपर्टी ब्यौरा
मॉडल कोड

Gemini API

models/text-embedding-004

इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट एम्बेड करना

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,048

आउटपुट डाइमेंशन का साइज़

768

रेट की सीमा[**] हर मिनट 1,500 अनुरोध
अडजस्ट की जा सकने वाली सुरक्षा सेटिंग काम नहीं करता है
नया अपडेट अप्रैल 2024

एम्बेड करना

अपने-आप जनरेट होने वाले विज्ञापनों के लिए, एम्बेडिंग मॉडल का इस्तेमाल किया जा सकता है इनके लिए टेक्स्ट एम्बेड करना टेक्स्ट डालें.

एम्बेड करने वाले मॉडल को 768 डाइमेंशन के साथ एम्बेड करने के लिए ऑप्टिमाइज़ किया गया है ज़्यादा से ज़्यादा 2,048 टोकन वाले टेक्स्ट के लिए.

एम्बेड करने वाले मॉडल की जानकारी
प्रॉपर्टी ब्यौरा
मॉडल कोड models/embedding-001
इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट एम्बेड करना

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,048

आउटपुट डाइमेंशन का साइज़

768

रेट की सीमा[**] हर मिनट 1,500 अनुरोध
अडजस्ट की जा सकने वाली सुरक्षा सेटिंग काम नहीं करता है
नया अपडेट दिसंबर 2023

AQA

एक्यूआई मॉडल का इस्तेमाल करके, बेहतर परफ़ॉर्म किया जा सकता है एट्रिब्यूट किए गए सवालों के जवाब (एक्यूए)–किसी दस्तावेज़, कॉर्पस या पैसेज के सेट से जुड़े टास्क. एक्यूए मॉडल ऐसे सवालों के जवाब देता है जो दिए गए सोर्स पर आधारित होते हैं. और जवाब देने की संभावना का अनुमान लगाना.

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/aqa
इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट

इस्तेमाल की जा सकने वाली भाषा अंग्रेज़ी
टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

7,168

आउटपुट टोकन की सीमा

1,024

रेट की सीमा[**] हर मिनट 1,500 अनुरोध
अडजस्ट की जा सकने वाली सुरक्षा सेटिंग काम करता है
नया अपडेट दिसंबर 2023

इन मॉडल की क्षमताओं को एक्सप्लोर करने के लिए, उदाहरण देखें अलग-अलग वर्शन.

[*] एक टोकन, Gemini मॉडल के लिए करीब 4 वर्णों के बराबर होता है. 100 टोकन अंग्रेज़ी के करीब 60 से 80 शब्द हैं.

[**] आरपीएम: हर मिनट मिलने वाले अनुरोध
टीपीएम: टोकन प्रति मिनट
आरपीडी: हर दिन मिलने वाले अनुरोध
TPD: टोकन हर दिन

क्षमता की सीमाओं की वजह से, तय की गई ज़्यादा से ज़्यादा दर सीमाएं नहीं हैं गारंटी के साथ.

मॉडल के वर्शन के नाम के पैटर्न

Gemini के मॉडल, झलक या स्टेबल वर्शन में उपलब्ध हैं. अपने है, तो आप नीचे दिए गए मॉडल नाम फ़ॉर्मैट में से किसी एक का इस्तेमाल करके यह तय कर सकते हैं कि कौनसा मॉडल इस्तेमाल करना है.

  • सबसे नया: किसी खास मॉडल के सबसे नए वर्शन पर ले जाता है जेनरेशन और वैरिएशन वाली सेटिंग. मौजूदा मॉडल को नियमित रूप से अपडेट किया जाता है. ऐसा करने से इस्तेमाल करें. सिर्फ़ एक्सप्लोरेट्री टेस्टिंग ऐप्लिकेशन और प्रोटोटाइप को इस उपनाम का इस्तेमाल करें.

    नया वर्शन तय करने के लिए, नीचे दिए गए पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-latest. उदाहरण के लिए, gemini-1.0-pro-latest.

  • नए स्टेबल वर्शन: मॉडल जनरेशन और वैरिएशन वाली सेटिंग तय करें.

    नए स्टेबल वर्शन की जानकारी देने के लिए, नीचे दिए गए पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>. उदाहरण के लिए, gemini-1.0-pro.

  • स्टेबल: किसी खास स्टेबल मॉडल पर ले जाता है. स्थिर मॉडल में कोई बदलाव नहीं होता. ज़्यादातर प्रोडक्शन ऐप्लिकेशन को, किसी खास स्टेबल मॉडल का इस्तेमाल करना चाहिए.

    स्टेबल वर्शन तय करने के लिए, नीचे दिए गए पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-<version>. उदाहरण के लिए, gemini-1.0-pro-001.

  • प्रयोग के तौर पर उपलब्ध: उपयोगकर्ता को 'झलक देखें' मोड में मौजूद, प्रयोग के तौर पर उपलब्ध किसी मॉडल पर ले जाता है, जैसा कि शर्तों में बताया गया है, इसका मतलब है कि यह प्रोडक्शन के लिए नहीं है. हमने एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल रिलीज़ किए लोगों के सुझाव, राय या शिकायतें इकट्ठा करने के लिए, हमारे नए अपडेट डेवलपर को दें साथ ही, Google में हो रहे इनोवेशन की रफ़्तार को हाइलाइट कर सके. क्या फ़ायदे दें जब हम एक्सपेरिमेंट के तौर पर उपलब्ध सुविधाओं से सीखते हैं, तो हमें यह जानकारी मिलती है कि हम अपने मॉडल को कैसे रिलीज़ करते हैं है. किसी एक्सपेरिमेंटल मॉडल को बिना पहले इस्तेमाल किए किसी अन्य मॉडल से बदला जा सकता है सूचना. हम इस बात की गारंटी नहीं देते कि कोई प्रायोगिक मॉडल ताकि इन मॉडल की परफ़ॉर्मेंस को बेहतर बनाया जा सके.

    प्रयोग के तौर पर उपलब्ध वर्शन तय करने के लिए, नीचे दिए गए पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-<version>. उदाहरण के लिए, gemini-1.5-pro-exp-0801.

उपलब्ध भाषाएं

Gemini के मॉडल को इन भाषाओं के साथ काम करने की ट्रेनिंग दी गई है:

  • ऐरेबिक (ar)
  • बांग्ला (bn)
  • बल्गेरियन (bg)
  • चीनी सरल और पारंपरिक (zh)
  • क्रोएशियन (hr)
  • चेक (cs)
  • डेनिश (da)
  • डच (nl)
  • अंग्रेज़ी (en)
  • एस्टोनियन (et)
  • फ़िनिश (fi)
  • फ़्रेंच (fr)
  • जर्मन (de)
  • ग्रीक (el)
  • हिब्रू (iw)
  • हिन्दी (hi)
  • हंगेरियन (hu)
  • इंडोनेशियन (id)
  • इटैलियन (it)
  • जैपनीज़ (ja)
  • कोरियन (ko)
  • लातवियन (lv)
  • लिथुएनियन (lt)
  • नॉर्वेजियाई (no)
  • पोलिश (pl)
  • पुर्तगाली (pt)
  • रोमेनियन (ro)
  • रशियन (ru)
  • सर्बियाई (sr)
  • स्लोवाक (sk)
  • स्लोवेनियन (sl)
  • स्पैनिश (es)
  • स्वाहिली (sw)
  • स्वीडिश (sv)
  • थाई (th)
  • टर्किश (tr)
  • यूक्रेनियन (uk)
  • वियतनामीज़ (vi)