1.5 Flash
हमारा सबसे तेज़ और सबसे किफ़ायती मल्टीमॉडल मॉडल, जिसकी परफ़ॉर्मेंस ज़्यादा फ़्रीक्वेंसी वाले टास्क के लिए है
- ऑडियो, इमेज, वीडियो, और टेक्स्ट इनपुट करें और मैसेज से जवाब पाएं
- कोड जनरेट करने, डेटा एक्सट्रैक्ट करने, टेक्स्ट में बदलाव करने जैसे कई काम करें
- कम और ज़्यादा समय वाले कामों के लिए सबसे अच्छा है
1.5 Pro
यह सबसे अच्छा परफ़ॉर्म करने वाला मल्टीमॉडल मॉडल है. इसमें कई तरह के रीज़निंग से जुड़े कामों के लिए सुविधाएं दी गई हैं
- ऑडियो, इमेज, वीडियो, और टेक्स्ट इनपुट करें और मैसेज से जवाब पाएं
- कोड जनरेट करने, डेटा एक्सट्रैक्ट करने, टेक्स्ट में बदलाव करने जैसे कई काम करें
- जब आपको परफ़ॉर्मेंस को बेहतर बनाने की ज़रूरत हो
मॉडल के वैरिएंट
Gemini API में ऐसे अलग-अलग मॉडल उपलब्ध हैं जिन्हें इस्तेमाल के खास उदाहरणों के हिसाब से ऑप्टिमाइज़ किया गया है. Gemini के उपलब्ध वैरिएंट के बारे में खास जानकारी यहां दी गई है:
मॉडल का वैरिएंट | इनपुट | आउटपुट | इसके लिए ऑप्टिमाइज़ किया गया |
---|---|---|---|
Gemini 1.5 Pro
gemini-1.5-pro |
ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | रीज़निंग से जुड़े जटिल टास्क. जैसे, कोड और टेक्स्ट जनरेट करना, टेक्स्ट में बदलाव करना, समस्या हल करना, डेटा निकालना, और जनरेट करना |
Gemini 1.5 Flash
gemini-1.5-flash |
ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | कई तरह के टास्क के लिए तेज़ और शानदार परफ़ॉर्मेंस |
Gemini 1.0 Pro
gemini-1.0-pro |
टेक्स्ट | टेक्स्ट | सामान्य भाषा से जुड़े टास्क, बार-बार होने वाले टेक्स्ट और कोड चैट, और कोड जनरेट करना |
(अब काम नहीं करता) Gemini 1.0 Pro Vision
gemini-pro-vision
|
इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | विज़ुअल से जुड़े काम, जैसे कि इमेज के बारे में जानकारी जनरेट करना या इमेज में मौजूद चीज़ों की पहचान करना |
टेक्स्ट एम्बेड करना
text-embedding-004 |
टेक्स्ट | टेक्स्ट एम्बेड करना | टेक्स्ट स्ट्रिंग के बीच संबंध का पता लगाना |
एक्यूए
aqa |
टेक्स्ट | टेक्स्ट | सवालों के सोर्स के आधार पर जवाब देना |
यहां दी गई टेबल में, Gemini के अलग-अलग मॉडल के एट्रिब्यूट के बारे में बताया गया है. ये एट्रिब्यूट, मॉडल के सभी वैरिएंट के लिए आम तौर पर इस्तेमाल किए जाते हैं:
एट्रिब्यूट | जानकारी |
---|---|
ट्रेनिंग का डेटा | Gemini का नॉलेज कटऑफ़ समय नवंबर 2023 है. उस समय के बाद के इवेंट के बारे में सीमित जानकारी होती है. |
Gemini का मोबाइल ऐप्लिकेशन इन भाषाओं में काम करता है | उपलब्ध भाषाएं देखें |
कॉन्फ़िगर किए जा सकने वाले मॉडल पैरामीटर |
|
इनमें से हर पैरामीटर के बारे में जानकारी के लिए, जनरेटिव मॉडल गाइड का मॉडल पैरामीटर सेक्शन देखें.
Gemini 1.5 फ़्लैश
Gemini 1.5 Flash, तेज़ और कई तरह से काम करने वाला मल्टीमोडल मॉडल है. इसकी मदद से, अलग-अलग तरह के टास्क पूरे किए जा सकते हैं.
मॉडल का विवरण
प्रॉपर्टी | जानकारी |
---|---|
मॉडल कोड | models/gemini-1.5-flash |
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 10,48,576 आउटपुट टोकन की सीमा 8,192 |
ऑडियो/विज़ुअल की जानकारी |
हर प्रॉम्प्ट में ज़्यादा से ज़्यादा इमेज शामिल करने की संख्या 3,600 वीडियो कितना लंबा होना चाहिए 1 घंटे में ऑडियो कितना लंबा हो सकता है करीब 9.5 घंटे |
[**] | रेट की सीमा
|
क्षमताएं |
सिस्टम के लिए निर्देश काम करता है JSON मोड काम करता है JSON स्कीमा काम नहीं करता है सुरक्षा में बदलाव करने की सेटिंग काम करता है कैश मेमोरी में सेव करना काम करता है ट्यूनिंग काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन काम करता है कोड लागू करना काम करता है |
नया अपडेट | मई 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro एक मीडियम साइज़ का मल्टीमॉडल मॉडल है. इसे कई तरह के रीज़निंग से जुड़े कामों के लिए ऑप्टिमाइज़ किया गया है. 1.5 Pro एक बार में बहुत ज़्यादा डेटा प्रोसेस कर सकता है. इसमें दो घंटे का वीडियो, 19 घंटे का ऑडियो, 60,000 लाइनों वाले कोड बेस या 2,000 पेज के टेक्स्ट शामिल हैं.
मॉडल का विवरण
प्रॉपर्टी | जानकारी |
---|---|
मॉडल कोड | models/gemini-1.5-pro |
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 20,97,152 आउटपुट टोकन की सीमा 8,192 |
ऑडियो/विज़ुअल की जानकारी |
हर प्रॉम्प्ट में ज़्यादा से ज़्यादा इमेज शामिल करने की संख्या 7,200 वीडियो कितना लंबा होना चाहिए 2 घंटे ऑडियो कितना लंबा हो सकता है करीब 19 घंटे |
[**] | रेट की सीमा
|
क्षमताएं |
सिस्टम के लिए निर्देश काम करता है JSON मोड काम करता है JSON स्कीमा काम करता है सुरक्षा में बदलाव करने की सेटिंग काम करता है कैश मेमोरी में सेव करना काम करता है ट्यूनिंग काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन काम करता है कोड लागू करना काम करता है |
नया अपडेट | मई 2024 |
Gemini 1.0 Pro
Gemini 1.0 Pro एक एनएलपी मॉडल है. यह एक साथ कई काम करने वाले टेक्स्ट, कोड चैट, और कोड जनरेट करने जैसे काम करता है.
मॉडल का विवरण
प्रॉपर्टी | जानकारी |
---|---|
मॉडल कोड | models/gemini-1.0-pro |
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट टेक्स्ट आउटपुट टेक्स्ट |
[**] | रेट की सीमा
|
क्षमताएं |
सिस्टम के लिए निर्देश काम नहीं करता है JSON मोड काम नहीं करता है JSON स्कीमा काम नहीं करता है सुरक्षा में बदलाव करने की सेटिंग काम करता है कैश मेमोरी में सेव करना काम नहीं करता है ट्यूनिंग काम करता है फ़ंक्शन कॉलिंग काम करता है फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन काम नहीं करता है कोड लागू करना काम नहीं करता है |
नया अपडेट | फ़रवरी 2024 |
Gemini 1.0 Pro Vision की सुविधा अब उपलब्ध नहीं है
Gemini 1.0 Pro Vision, परफ़ॉर्मेंस के हिसाब से ऑप्टिमाइज़ किया गया एक मल्टीमॉडल मॉडल है. यह विज़ुअल से जुड़े टास्क कर सकता है. उदाहरण के लिए, 1.0 Pro Vision की मदद से, इमेज की जानकारी जनरेट की जा सकती है, इमेज में मौजूद चीज़ों की पहचान की जा सकती है, इमेज में मौजूद जगहों या चीज़ों के बारे में जानकारी दी जा सकती है. इसके अलावा, ऐसे और भी कई काम किए जा सकते हैं.
मॉडल का विवरण
प्रॉपर्टी | जानकारी |
---|---|
मॉडल कोड | models/gemini-pro-vision |
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 12,288 आउटपुट टोकन की सीमा 4,096 |
ऑडियो/विज़ुअल की जानकारी |
वीडियो कितना लंबा होना चाहिए 2 मिनट |
[**] | रेट की सीमाहर मिनट 60 अनुरोध |
क्षमताएं |
सिस्टम के लिए निर्देश काम नहीं करता है JSON मोड काम नहीं करता है JSON स्कीमा काम नहीं करता है सुरक्षा में बदलाव करने की सेटिंग काम करता है कैश मेमोरी में सेव करना काम नहीं करता है ट्यूनिंग काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन काम नहीं करता है कोड लागू करना काम नहीं करता है |
नया अपडेट | दिसंबर 2023 |
टेक्स्ट एम्बेड और एम्बेड करना
लेख एम्बेड करना
टेक्स्ट एम्बेड करने के मॉडल का इस्तेमाल करके, टेक्स्ट एम्बेड करने की सुविधा जनरेट की जा सकती है. टेक्स्ट एम्बेड करने वाले मॉडल के बारे में ज़्यादा जानकारी के लिए, टेक्स्ट एम्बेड करने से जुड़े Vertex AI के लिए जनरेटिव एआई से जुड़ा दस्तावेज़ देखें.
टेक्स्ट एम्बेड करने वाले मॉडल को 768 डाइमेंशन के साथ एम्बेड करने की प्रोसेस के लिए ऑप्टिमाइज़ किया गया है. ऐसा, 2,048 टोकन वाले टेक्स्ट के लिए किया जा सकता है. टेक्स्ट एम्बेड करने की सुविधा, 768 से कम साइज़ के इलास्टिक एम्बेड करने की सुविधा देती है. इलास्टिक एम्बेड करने की सुविधा का इस्तेमाल करके, आउटपुट के छोटे डाइमेंशन जनरेट किए जा सकते हैं. साथ ही, परफ़ॉर्मेंस में होने वाले मामूली नुकसान के साथ, कंप्यूटिंग और स्टोरेज की लागत में भी बचत की जा सकती है.
मॉडल का विवरण
प्रॉपर्टी | जानकारी |
---|---|
मॉडल कोड |
Gemini API
|
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट टेक्स्ट आउटपुट टेक्स्ट एम्बेड करना |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 2,048 आउटपुट डाइमेंशन का साइज़ 768 |
[**] | रेट की सीमाहर मिनट 1,500 अनुरोध |
अडजस्ट की जा सकने वाली सुरक्षा सेटिंग | काम नहीं करता है |
नया अपडेट | अप्रैल 2024 |
एम्बेडिंग
अगर आपको इनपुट टेक्स्ट के लिए, टेक्स्ट एम्बेड करने की सुविधा जनरेट करनी है, तो एम्बेड करने के मॉडल का इस्तेमाल किया जा सकता है.
एम्बेड करने वाले मॉडल को, 768 डाइमेंशन वाले एम्बेड करने के लिए ऑप्टिमाइज़ किया गया है. इससे, ज़्यादा से ज़्यादा 2,048 टोकन वाले टेक्स्ट के लिए, एम्बेड किए जा सकेंगे.
एम्बेड करने वाले मॉडल की जानकारी
प्रॉपर्टी | जानकारी |
---|---|
मॉडल कोड |
models/embedding-001
|
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट टेक्स्ट आउटपुट टेक्स्ट एम्बेड करना |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 2,048 आउटपुट डाइमेंशन का साइज़ 768 |
[**] | रेट की सीमाहर मिनट 1,500 अनुरोध |
अडजस्ट की जा सकने वाली सुरक्षा सेटिंग | काम नहीं करता है |
नया अपडेट | दिसंबर 2023 |
एक्यूए
एक्यूआई मॉडल का इस्तेमाल, एट्रिब्यूट किए गए सवालों के जवाब (एक्यूए) से जुड़े टास्क करने के लिए किया जा सकता है. इन टास्क को किसी दस्तावेज़, कॉर्पस या पैसेज के सेट के साथ किया जा सकता है. एक्यूए मॉडल से, दिए गए सोर्स पर आधारित सवालों के जवाब मिलते हैं. साथ ही, इससे मिलने वाले जवाब की संभावना का अनुमान भी लगाया जाता है.
मॉडल का विवरण
प्रॉपर्टी | जानकारी |
---|---|
मॉडल कोड | models/aqa |
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट टेक्स्ट आउटपुट टेक्स्ट |
इस्तेमाल की जा सकने वाली भाषा | अंग्रेज़ी |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 7,168 आउटपुट टोकन की सीमा 1,024 |
[**] | रेट की सीमाहर मिनट 1,500 अनुरोध |
अडजस्ट की जा सकने वाली सुरक्षा सेटिंग | काम करता है |
नया अपडेट | दिसंबर 2023 |
मॉडल के अलग-अलग वैरिएंट की क्षमताओं के बारे में जानने के लिए, उदाहरण देखें.
[*] एक टोकन, Gemini मॉडल के लिए करीब 4 वर्णों के बराबर होता है. 100 टोकन, करीब 60 से 80 अंग्रेज़ी शब्दों के होते हैं.
[**] आरपीएम: हर मिनट मिलने वाले अनुरोध
टीपीएम: टोकन प्रति मिनट
आरपीडी: हर दिन मिलने वाले अनुरोध
टीपीडी: टोकन हर दिन
क्षमता की सीमाओं की वजह से, तय की गई ज़्यादा से ज़्यादा रेट लिमिट की गारंटी नहीं है.
मॉडल के वर्शन के नाम के पैटर्न
Gemini के मॉडल, झलक या स्टेबल वर्शन में उपलब्ध हैं. अपने कोड में, आपको मॉडल के नाम वाले इन फ़ॉर्मैट में से किसी एक का इस्तेमाल करके, यह तय करने की सुविधा मिलती है कि आपको किस मॉडल और वर्शन का इस्तेमाल करना है.
सबसे नया: किसी खास जनरेशन और वैरिएशन के लिए, मॉडल के सबसे नए वर्शन पर ले जाता है. दिया गया मॉडल नियमित रूप से अपडेट किया जाता है और यह झलक वाला वर्शन हो सकता है. इस उपनाम का इस्तेमाल, सिर्फ़ एक्सप्लोरेट्री टेस्टिंग ऐप्लिकेशन और प्रोटोटाइप में किया जाना चाहिए.
नया वर्शन तय करने के लिए, इस पैटर्न का इस्तेमाल करें:
<model>-<generation>-<variation>-latest
. उदाहरण के लिए,gemini-1.0-pro-latest
.नए स्टेबल वर्शन: चुनिंदा मॉडल जनरेशन और वैरिएशन के लिए, हाल ही में रिलीज़ हुए स्टेबल वर्शन पर ले जाता है.
नए स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें:
<model>-<generation>-<variation>
. उदाहरण के लिए,gemini-1.0-pro
.स्टेबल: किसी खास स्टेबल मॉडल पर ले जाता है. स्थिर मॉडल में कोई बदलाव नहीं होता. ज़्यादातर प्रोडक्शन ऐप्लिकेशन को, किसी खास स्टेबल मॉडल का इस्तेमाल करना चाहिए.
स्टेबल वर्शन तय करने के लिए, इस पैटर्न का इस्तेमाल करें:
<model>-<generation>-<variation>-<version>
. उदाहरण के लिए,gemini-1.0-pro-001
.
उपलब्ध भाषाएँ
Gemini के मॉडल को इन भाषाओं के साथ काम करने की ट्रेनिंग दी गई है:
- ऐरेबिक (
ar
) - बांग्ला (
bn
) - बल्गेरियन (
bg
) - चीनी सरल और पारंपरिक (
zh
) - क्रोएशियन (
hr
) - चेक (
cs
) - डेनिश (
da
) - डच (
nl
) - अंग्रेज़ी (
en
) - एस्टोनियन (
et
) - फ़िनिश (
fi
) - फ़्रेंच (
fr
) - जर्मन (
de
) - ग्रीक (
el
) - हिब्रू (
iw
) - हिन्दी (
hi
) - हंगेरियन (
hu
) - इंडोनेशियन (
id
) - इटैलियन (
it
) - जैपनीज़ (
ja
) - कोरियन (
ko
) - लातवियन (
lv
) - लिथुएनियन (
lt
) - नॉर्वेजियाई (
no
) - पोलिश (
pl
) - पुर्तगाली (
pt
) - रोमेनियन (
ro
) - रशियन (
ru
) - सर्बियाई (
sr
) - स्लोवाक (
sk
) - स्लोवेनियन (
sl
) - स्पैनिश (
es
) - स्वाहिली (
sw
) - स्वीडिश (
sv
) - थाई (
th
) - टर्किश (
tr
) - यूक्रेनियन (
uk
) - वियतनामीज़ (
vi
)