Gemini

मॉडल के वैरिएंट

Gemini API में ऐसे अलग-अलग मॉडल उपलब्ध हैं जिन्हें इस्तेमाल के खास उदाहरणों के हिसाब से ऑप्टिमाइज़ किया गया है. Gemini के उपलब्ध वैरिएंट के बारे में खास जानकारी यहां दी गई है:

मॉडल का वैरिएंट इनपुट आउटपुट इसके लिए ऑप्टिमाइज़ किया गया
Gemini 1.5 Pro
gemini-1.5-pro
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट रीज़निंग से जुड़े जटिल टास्क. जैसे, कोड और टेक्स्ट जनरेट करना, टेक्स्ट में बदलाव करना, समस्या हल करना, डेटा निकालना, और जनरेट करना
Gemini 1.5 Flash
gemini-1.5-flash
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट कई तरह के टास्क के लिए तेज़ और शानदार परफ़ॉर्मेंस
Gemini 1.0 Pro
gemini-1.0-pro
टेक्स्ट टेक्स्ट सामान्य भाषा से जुड़े टास्क, बार-बार होने वाले टेक्स्ट और कोड चैट, और कोड जनरेट करना
(अब काम नहीं करता) Gemini 1.0 Pro Vision
gemini-pro-vision
इमेज, वीडियो, और टेक्स्ट टेक्स्ट विज़ुअल से जुड़े काम, जैसे कि इमेज के बारे में जानकारी जनरेट करना या इमेज में मौजूद चीज़ों की पहचान करना
टेक्स्ट एम्बेड करना
text-embedding-004
टेक्स्ट टेक्स्ट एम्बेड करना टेक्स्ट स्ट्रिंग के बीच संबंध का पता लगाना
एक्यूए
aqa
टेक्स्ट टेक्स्ट सवालों के सोर्स के आधार पर जवाब देना

यहां दी गई टेबल में, Gemini के अलग-अलग मॉडल के एट्रिब्यूट के बारे में बताया गया है. ये एट्रिब्यूट, मॉडल के सभी वैरिएंट के लिए आम तौर पर इस्तेमाल किए जाते हैं:

एट्रिब्यूट जानकारी
ट्रेनिंग का डेटा Gemini का नॉलेज कटऑफ़ समय नवंबर 2023 है. उस समय के बाद के इवेंट के बारे में सीमित जानकारी होती है.
Gemini का मोबाइल ऐप्लिकेशन इन भाषाओं में काम करता है उपलब्ध भाषाएं देखें
कॉन्फ़िगर किए जा सकने वाले मॉडल पैरामीटर
  • सबसे ऊपर p
  • टॉप के
  • तापमान
  • स्टॉप का क्रम
  • आउटपुट की ज़्यादा से ज़्यादा लंबाई
  • जवाब देने वाले उम्मीदवारों की संख्या

इनमें से हर पैरामीटर के बारे में जानकारी के लिए, जनरेटिव मॉडल गाइड का मॉडल पैरामीटर सेक्शन देखें.

Gemini 1.5 फ़्लैश

Gemini 1.5 Flash, तेज़ और कई तरह से काम करने वाला मल्टीमोडल मॉडल है. इसकी मदद से, अलग-अलग तरह के टास्क पूरे किए जा सकते हैं.

AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी जानकारी
मॉडल कोड models/gemini-1.5-flash
इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

10,48,576

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की जानकारी

हर प्रॉम्प्ट में ज़्यादा से ज़्यादा इमेज शामिल करने की संख्या

3,600

वीडियो कितना लंबा होना चाहिए

1 घंटे में

ऑडियो कितना लंबा हो सकता है

करीब 9.5 घंटे

रेट की सीमा[**]
मुफ़्त:
  • 15 आरपीएम
  • 10 लाख टीपीएम
  • 1,500 आरपीडी
Pay-as-you-go:
  • 1,000 आरपीएम
  • 20 लाख टीपीएम
क्षमताएं

सिस्टम के लिए निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम नहीं करता है

सुरक्षा में बदलाव करने की सेटिंग

काम करता है

कैश मेमोरी में सेव करना

काम करता है

ट्यूनिंग

काम नहीं करता है

फ़ंक्शन कॉलिंग

काम करता है

फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन

काम करता है

कोड लागू करना

काम करता है

नया अपडेट मई 2024

Gemini 1.5 Pro

Gemini 1.5 Pro एक मीडियम साइज़ का मल्टीमॉडल मॉडल है. इसे कई तरह के रीज़निंग से जुड़े कामों के लिए ऑप्टिमाइज़ किया गया है. 1.5 Pro एक बार में बहुत ज़्यादा डेटा प्रोसेस कर सकता है. इसमें दो घंटे का वीडियो, 19 घंटे का ऑडियो, 60,000 लाइनों वाले कोड बेस या 2,000 पेज के टेक्स्ट शामिल हैं.

AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी जानकारी
मॉडल कोड models/gemini-1.5-pro
इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

20,97,152

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की जानकारी

हर प्रॉम्प्ट में ज़्यादा से ज़्यादा इमेज शामिल करने की संख्या

7,200

वीडियो कितना लंबा होना चाहिए

2 घंटे

ऑडियो कितना लंबा हो सकता है

करीब 19 घंटे

रेट की सीमा[**]
मुफ़्त:
  • 2 आरपीएम
  • 32,000 टीपीएम
  • 50 आरपीडी
Pay-as-you-go:
  • 360 आरपीएम
  • 20 लाख टीपीएम
  • 10,000 आरपीडी
क्षमताएं

सिस्टम के लिए निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम करता है

सुरक्षा में बदलाव करने की सेटिंग

काम करता है

कैश मेमोरी में सेव करना

काम करता है

ट्यूनिंग

काम नहीं करता है

फ़ंक्शन कॉलिंग

काम करता है

फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन

काम करता है

कोड लागू करना

काम करता है

नया अपडेट मई 2024

Gemini 1.0 Pro

Gemini 1.0 Pro एक एनएलपी मॉडल है. यह एक साथ कई काम करने वाले टेक्स्ट, कोड चैट, और कोड जनरेट करने जैसे काम करता है.

AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी जानकारी
मॉडल कोड models/gemini-1.0-pro
इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट

रेट की सीमा[**]
मुफ़्त:
  • 15 आरपीएम
  • 32,000 टीपीएम
  • 1,500 आरपीडी
Pay-as-you-go:
  • 360 आरपीएम
  • 1,20,000 टीपीएम
  • 30,000 आरपीडी
क्षमताएं

सिस्टम के लिए निर्देश

काम नहीं करता है

JSON मोड

काम नहीं करता है

JSON स्कीमा

काम नहीं करता है

सुरक्षा में बदलाव करने की सेटिंग

काम करता है

कैश मेमोरी में सेव करना

काम नहीं करता है

ट्यूनिंग

काम करता है

फ़ंक्शन कॉलिंग

काम करता है

फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन

काम नहीं करता है

कोड लागू करना

काम नहीं करता है

नया अपडेट फ़रवरी 2024

Gemini 1.0 Pro Vision की सुविधा अब उपलब्ध नहीं है

Gemini 1.0 Pro Vision, परफ़ॉर्मेंस के हिसाब से ऑप्टिमाइज़ किया गया एक मल्टीमॉडल मॉडल है. यह विज़ुअल से जुड़े टास्क कर सकता है. उदाहरण के लिए, 1.0 Pro Vision की मदद से, इमेज की जानकारी जनरेट की जा सकती है, इमेज में मौजूद चीज़ों की पहचान की जा सकती है, इमेज में मौजूद जगहों या चीज़ों के बारे में जानकारी दी जा सकती है. इसके अलावा, ऐसे और भी कई काम किए जा सकते हैं.

मॉडल का विवरण

प्रॉपर्टी जानकारी
मॉडल कोड models/gemini-pro-vision
इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

12,288

आउटपुट टोकन की सीमा

4,096

ऑडियो/विज़ुअल की जानकारी

वीडियो कितना लंबा होना चाहिए

2 मिनट

रेट की सीमा[**] हर मिनट 60 अनुरोध
क्षमताएं

सिस्टम के लिए निर्देश

काम नहीं करता है

JSON मोड

काम नहीं करता है

JSON स्कीमा

काम नहीं करता है

सुरक्षा में बदलाव करने की सेटिंग

काम करता है

कैश मेमोरी में सेव करना

काम नहीं करता है

ट्यूनिंग

काम नहीं करता है

फ़ंक्शन कॉलिंग

काम करता है

फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन

काम नहीं करता है

कोड लागू करना

काम नहीं करता है

नया अपडेट दिसंबर 2023

टेक्स्ट एम्बेड और एम्बेड करना

लेख एम्बेड करना

टेक्स्ट एम्बेड करने के मॉडल का इस्तेमाल करके, टेक्स्ट एम्बेड करने की सुविधा जनरेट की जा सकती है. टेक्स्ट एम्बेड करने वाले मॉडल के बारे में ज़्यादा जानकारी के लिए, टेक्स्ट एम्बेड करने से जुड़े Vertex AI के लिए जनरेटिव एआई से जुड़ा दस्तावेज़ देखें.

टेक्स्ट एम्बेड करने वाले मॉडल को 768 डाइमेंशन के साथ एम्बेड करने की प्रोसेस के लिए ऑप्टिमाइज़ किया गया है. ऐसा, 2,048 टोकन वाले टेक्स्ट के लिए किया जा सकता है. टेक्स्ट एम्बेड करने की सुविधा, 768 से कम साइज़ के इलास्टिक एम्बेड करने की सुविधा देती है. इलास्टिक एम्बेड करने की सुविधा का इस्तेमाल करके, आउटपुट के छोटे डाइमेंशन जनरेट किए जा सकते हैं. साथ ही, परफ़ॉर्मेंस में होने वाले मामूली नुकसान के साथ, कंप्यूटिंग और स्टोरेज की लागत में भी बचत की जा सकती है.

मॉडल का विवरण
प्रॉपर्टी जानकारी
मॉडल कोड

Gemini API

models/text-embedding-004

Vertex AI

text-embedding-preview-0409

इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट एम्बेड करना

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,048

आउटपुट डाइमेंशन का साइज़

768

रेट की सीमा[**] हर मिनट 1,500 अनुरोध
अडजस्ट की जा सकने वाली सुरक्षा सेटिंग काम नहीं करता है
नया अपडेट अप्रैल 2024

एम्बेडिंग

अगर आपको इनपुट टेक्स्ट के लिए, टेक्स्ट एम्बेड करने की सुविधा जनरेट करनी है, तो एम्बेड करने के मॉडल का इस्तेमाल किया जा सकता है.

एम्बेड करने वाले मॉडल को, 768 डाइमेंशन वाले एम्बेड करने के लिए ऑप्टिमाइज़ किया गया है. इससे, ज़्यादा से ज़्यादा 2,048 टोकन वाले टेक्स्ट के लिए, एम्बेड किए जा सकेंगे.

एम्बेड करने वाले मॉडल की जानकारी
प्रॉपर्टी जानकारी
मॉडल कोड models/embedding-001
इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट एम्बेड करना

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,048

आउटपुट डाइमेंशन का साइज़

768

रेट की सीमा[**] हर मिनट 1,500 अनुरोध
अडजस्ट की जा सकने वाली सुरक्षा सेटिंग काम नहीं करता है
नया अपडेट दिसंबर 2023

एक्यूए

एक्यूआई मॉडल का इस्तेमाल, एट्रिब्यूट किए गए सवालों के जवाब (एक्यूए) से जुड़े टास्क करने के लिए किया जा सकता है. इन टास्क को किसी दस्तावेज़, कॉर्पस या पैसेज के सेट के साथ किया जा सकता है. एक्यूए मॉडल से, दिए गए सोर्स पर आधारित सवालों के जवाब मिलते हैं. साथ ही, इससे मिलने वाले जवाब की संभावना का अनुमान भी लगाया जाता है.

मॉडल का विवरण

प्रॉपर्टी जानकारी
मॉडल कोड models/aqa
इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट

इस्तेमाल की जा सकने वाली भाषा अंग्रेज़ी
टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

7,168

आउटपुट टोकन की सीमा

1,024

रेट की सीमा[**] हर मिनट 1,500 अनुरोध
अडजस्ट की जा सकने वाली सुरक्षा सेटिंग काम करता है
नया अपडेट दिसंबर 2023

मॉडल के अलग-अलग वैरिएंट की क्षमताओं के बारे में जानने के लिए, उदाहरण देखें.

[*] एक टोकन, Gemini मॉडल के लिए करीब 4 वर्णों के बराबर होता है. 100 टोकन, करीब 60 से 80 अंग्रेज़ी शब्दों के होते हैं.

[**] आरपीएम: हर मिनट मिलने वाले अनुरोध
टीपीएम: टोकन प्रति मिनट
आरपीडी: हर दिन मिलने वाले अनुरोध
टीपीडी: टोकन हर दिन

क्षमता की सीमाओं की वजह से, तय की गई ज़्यादा से ज़्यादा रेट लिमिट की गारंटी नहीं है.

मॉडल के वर्शन के नाम के पैटर्न

Gemini के मॉडल, झलक या स्टेबल वर्शन में उपलब्ध हैं. अपने कोड में, आपको मॉडल के नाम वाले इन फ़ॉर्मैट में से किसी एक का इस्तेमाल करके, यह तय करने की सुविधा मिलती है कि आपको किस मॉडल और वर्शन का इस्तेमाल करना है.

  • सबसे नया: किसी खास जनरेशन और वैरिएशन के लिए, मॉडल के सबसे नए वर्शन पर ले जाता है. दिया गया मॉडल नियमित रूप से अपडेट किया जाता है और यह झलक वाला वर्शन हो सकता है. इस उपनाम का इस्तेमाल, सिर्फ़ एक्सप्लोरेट्री टेस्टिंग ऐप्लिकेशन और प्रोटोटाइप में किया जाना चाहिए.

    नया वर्शन तय करने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-latest. उदाहरण के लिए, gemini-1.0-pro-latest.

  • नए स्टेबल वर्शन: चुनिंदा मॉडल जनरेशन और वैरिएशन के लिए, हाल ही में रिलीज़ हुए स्टेबल वर्शन पर ले जाता है.

    नए स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>. उदाहरण के लिए, gemini-1.0-pro.

  • स्टेबल: किसी खास स्टेबल मॉडल पर ले जाता है. स्थिर मॉडल में कोई बदलाव नहीं होता. ज़्यादातर प्रोडक्शन ऐप्लिकेशन को, किसी खास स्टेबल मॉडल का इस्तेमाल करना चाहिए.

    स्टेबल वर्शन तय करने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-<version>. उदाहरण के लिए, gemini-1.0-pro-001.

उपलब्ध भाषाएँ

Gemini के मॉडल को इन भाषाओं के साथ काम करने की ट्रेनिंग दी गई है:

  • ऐरेबिक (ar)
  • बांग्ला (bn)
  • बल्गेरियन (bg)
  • चीनी सरल और पारंपरिक (zh)
  • क्रोएशियन (hr)
  • चेक (cs)
  • डेनिश (da)
  • डच (nl)
  • अंग्रेज़ी (en)
  • एस्टोनियन (et)
  • फ़िनिश (fi)
  • फ़्रेंच (fr)
  • जर्मन (de)
  • ग्रीक (el)
  • हिब्रू (iw)
  • हिन्दी (hi)
  • हंगेरियन (hu)
  • इंडोनेशियन (id)
  • इटैलियन (it)
  • जैपनीज़ (ja)
  • कोरियन (ko)
  • लातवियन (lv)
  • लिथुएनियन (lt)
  • नॉर्वेजियाई (no)
  • पोलिश (pl)
  • पुर्तगाली (pt)
  • रोमेनियन (ro)
  • रशियन (ru)
  • सर्बियाई (sr)
  • स्लोवाक (sk)
  • स्लोवेनियन (sl)
  • स्पैनिश (es)
  • स्वाहिली (sw)
  • स्वीडिश (sv)
  • थाई (th)
  • टर्किश (tr)
  • यूक्रेनियन (uk)
  • वियतनामीज़ (vi)