1.5 फ़्लैश
बेहतरीन परफ़ॉर्मेंस वाला हमारा सबसे तेज़ और किफ़ायती मल्टीमॉडल मॉडल ज़्यादा फ़्रीक्वेंसी वाले टास्क के लिए
- ऑडियो, इमेज, वीडियो, और टेक्स्ट इनपुट करें और मैसेज से जवाब पाएं
- कोड जनरेट करने, डेटा एक्सट्रैक्ट करने, टेक्स्ट में बदलाव करने जैसे कई काम करें
- कम और ज़्यादा समय वाले कामों के लिए सबसे अच्छा है
1.5 Pro
यह सबसे अच्छा परफ़ॉर्म करने वाला मल्टीमॉडल मॉडल है. इसमें कई तरह के रीज़निंग से जुड़े कामों के लिए सुविधाएं दी गई हैं
- ऑडियो, इमेज, वीडियो, और टेक्स्ट इनपुट करें और मैसेज से जवाब पाएं
- कोड जनरेट करने, डेटा एक्सट्रैक्ट करने, टेक्स्ट में बदलाव करने जैसे कई काम करें
- जब आपको परफ़ॉर्मेंस को बेहतर बनाने की ज़रूरत हो
मॉडल के वैरिएंट
Gemini API के अलग-अलग मॉडल उपलब्ध हैं. इन्हें चुनिंदा कामों के लिए ऑप्टिमाइज़ किया गया है मामले. Gemini के उपलब्ध वैरिएंट के बारे में खास जानकारी यहां दी गई है:
मॉडल का वैरिएंट | इनपुट | आउटपुट | इसके लिए ऑप्टिमाइज़ किया गया |
---|---|---|---|
Gemini 1.5 Pro
gemini-1.5-pro |
ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | रीज़निंग से जुड़े जटिल टास्क, जैसे कि कोड और टेक्स्ट जनरेट करना, टेक्स्ट एडिटिंग, समस्या हल करना, डेटा निकालना, और जनरेशन |
Gemini 1.5 Flash
gemini-1.5-flash |
ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | कई तरह के टास्क के लिए तेज़ और शानदार परफ़ॉर्मेंस |
Gemini 1.0 Pro
gemini-1.0-pro |
टेक्स्ट | टेक्स्ट | सामान्य भाषा से जुड़े टास्क, बार-बार आने वाले टेक्स्ट, कोड चैट, और कोड जनरेशन |
(अब काम नहीं करता) Gemini 1.0 Pro Vision
gemini-pro-vision
|
इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | विज़ुअल से जुड़े टास्क, जैसे कि इमेज जनरेट करना इमेज में मौजूद चीज़ों का ब्यौरा या पहचान करने वाली चीज़ें |
टेक्स्ट एम्बेड करना
text-embedding-004 |
टेक्स्ट | टेक्स्ट एम्बेड करना | टेक्स्ट स्ट्रिंग के बीच संबंध का पता लगाना |
एक्यूए
aqa |
टेक्स्ट | टेक्स्ट | सवालों के सोर्स के आधार पर जवाब देना |
नीचे दी गई टेबल में, Gemini के इन मॉडल के एट्रिब्यूट के बारे में बताया गया है यह मॉडल के सभी वैरिएंट के लिए एक जैसा होता है:
एट्रिब्यूट | ब्यौरा |
---|---|
ट्रेनिंग का डेटा | Gemini का नॉलेज कटऑफ़ समय नवंबर 2023 है. उस समय के बाद के इवेंट के बारे में सीमित जानकारी होती है. |
Gemini का वेब ऐप्लिकेशन इन भाषाओं में उपलब्ध है | उपलब्ध भाषाएं देखें |
कॉन्फ़िगर किए जा सकने वाले मॉडल पैरामीटर |
|
मॉडल पैरामीटर देखें सेक्शन में, इनमें से हर पैरामीटर के बारे में जानकारी के लिए, जनरेटिव मॉडल गाइड पढ़ें.
Gemini 1.5 फ़्लैश
Gemini 1.5 Flash, तेज़ और कई तरह से काम करने वाला मल्टीमोडल मॉडल है. इसकी मदद से, स्केल को बड़ा किया जा सकता है अलग-अलग तरह के टास्क पूरे करने में मदद मिलती है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-1.5-flash |
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 10,48,576 आउटपुट टोकन की सीमा 8,192 |
ऑडियो/विज़ुअल की जानकारी |
हर प्रॉम्प्ट में ज़्यादा से ज़्यादा इमेज शामिल करने की संख्या 3,600 वीडियो कितना लंबा होना चाहिए 1 घंटा ऑडियो कितना लंबा हो सकता है करीब 9.5 घंटे |
[**] | रेट की सीमा
|
क्षमताएं |
सिस्टम के लिए निर्देश काम करता है JSON मोड काम करता है JSON स्कीमा काम नहीं करता है सुरक्षा में बदलाव करने की सेटिंग काम करता है कैश मेमोरी में सेव करना काम करता है ट्यूनिंग काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन काम करता है कोड लागू करना काम करता है |
नया अपडेट | मई 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro, मिड-साइज़ का एक मल्टीमॉडल मॉडल है. इसे रीज़निंग से जुड़े कई तरह के टास्क किए जा सकते हैं. 1.5 Pro बहुत ज़्यादा डेटा को प्रोसेस कर सकता है एक बार में, 2 घंटे के वीडियो, 19 घंटे के ऑडियो, और ऐसे कोड बेस के साथ जिनमें कोड की 60,000 लाइनें या टेक्स्ट के 2,000 पेज.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-1.5-pro |
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 20,97,152 आउटपुट टोकन की सीमा 8,192 |
ऑडियो/विज़ुअल की जानकारी |
हर प्रॉम्प्ट में ज़्यादा से ज़्यादा इमेज शामिल करने की संख्या 7,200 वीडियो कितना लंबा होना चाहिए 2 घंटे ऑडियो कितना लंबा हो सकता है करीब 19 घंटे |
[**] | रेट की सीमा
|
क्षमताएं |
सिस्टम के लिए निर्देश काम करता है JSON मोड काम करता है JSON स्कीमा काम करता है सुरक्षा में बदलाव करने की सेटिंग काम करता है कैश मेमोरी में सेव करना काम करता है ट्यूनिंग काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन काम करता है कोड लागू करना काम करता है |
नया अपडेट | मई 2024 |
Gemini 1.0 Pro
Gemini 1.0 Pro एक एनएलपी मॉडल है. यह एक साथ कई काम करने वाले टेक्स्ट और कोड चैट, और कोड जनरेशन.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-1.0-pro |
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट टेक्स्ट आउटपुट टेक्स्ट |
[**] | रेट की सीमा
|
क्षमताएं |
सिस्टम के लिए निर्देश काम नहीं करता है JSON मोड काम नहीं करता है JSON स्कीमा काम नहीं करता है सुरक्षा में बदलाव करने की सेटिंग काम करता है कैश मेमोरी में सेव करना काम नहीं करता है ट्यूनिंग काम करता है फ़ंक्शन कॉलिंग काम करता है फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन काम नहीं करता है कोड लागू करना काम नहीं करता है |
नया अपडेट | फ़रवरी 2024 |
Gemini 1.0 Pro Vision की सुविधा अब उपलब्ध नहीं है
Gemini 1.0 Pro Vision, परफ़ॉर्मेंस के हिसाब से ऑप्टिमाइज़ किया गया मल्टीमॉडल मॉडल है विज़ुअल से जुड़े काम कर सकें. उदाहरण के लिए, 1.0 Pro Vision की मदद से इमेज की जानकारी जनरेट करना, इमेज में मौजूद चीज़ों की पहचान करना, इमेज में मौजूद चीज़ों के बारे में जानकारी देना इमेज में मौजूद जगहों या चीज़ों के बारे में जानकारी वगैरह.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-pro-vision |
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 12,288 आउटपुट टोकन की सीमा 4,096 |
ऑडियो/विज़ुअल की जानकारी |
वीडियो कितना लंबा होना चाहिए 2 मिनट |
[**] | रेट की सीमाहर मिनट 60 अनुरोध |
क्षमताएं |
सिस्टम के लिए निर्देश काम नहीं करता है JSON मोड काम नहीं करता है JSON स्कीमा काम नहीं करता है सुरक्षा में बदलाव करने की सेटिंग काम करता है कैश मेमोरी में सेव करना काम नहीं करता है ट्यूनिंग काम नहीं करता है फ़ंक्शन कॉलिंग काम करता है फ़ंक्शन कॉलिंग कॉन्फ़िगरेशन काम नहीं करता है कोड लागू करना काम नहीं करता है |
नया अपडेट | दिसंबर 2023 |
टेक्स्ट एम्बेड और एम्बेड करना
लेख एम्बेड करना
टेक्स्ट एम्बेड करने वाले मॉडल का इस्तेमाल करके, इनके लिए टेक्स्ट एम्बेड करना टेक्स्ट डालें. टेक्स्ट एम्बेडिंग मॉडल के बारे में ज़्यादा जानकारी के लिए, Vertex AI में जनरेटिव एआई से जुड़ा दस्तावेज़ टेक्स्ट एम्बेड करने के बारे में जानकारी.
टेक्स्ट एम्बेड करने वाले मॉडल को 768 वर्शन के साथ एम्बेड करने के लिए ऑप्टिमाइज़ किया गया है ज़्यादा से ज़्यादा 2,048 टोकन वाले टेक्स्ट के डाइमेंशन. टेक्स्ट एम्बेड करने की सुविधा इलास्टिक की सुविधा देती है 768 से कम साइज़ एम्बेड करना. इलास्टिक एम्बेड करने की सुविधा का इस्तेमाल करके, इससे कम आउटपुट डाइमेंशन होते हैं. साथ ही, इससे कंप्यूटिंग और स्टोरेज की लागत में कमी आ सकती है परफ़ॉर्मेंस में मामूली गिरावट आई है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड |
Gemini API
|
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट टेक्स्ट आउटपुट टेक्स्ट एम्बेड करना |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 2,048 आउटपुट डाइमेंशन का साइज़ 768 |
[**] | रेट की सीमाहर मिनट 1,500 अनुरोध |
अडजस्ट की जा सकने वाली सुरक्षा सेटिंग | काम नहीं करता है |
नया अपडेट | अप्रैल 2024 |
एम्बेड करना
अपने-आप जनरेट होने वाले विज्ञापनों के लिए, एम्बेडिंग मॉडल का इस्तेमाल किया जा सकता है इनके लिए टेक्स्ट एम्बेड करना टेक्स्ट डालें.
एम्बेड करने वाले मॉडल को 768 डाइमेंशन के साथ एम्बेड करने के लिए ऑप्टिमाइज़ किया गया है ज़्यादा से ज़्यादा 2,048 टोकन वाले टेक्स्ट के लिए.
एम्बेड करने वाले मॉडल की जानकारी
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड |
models/embedding-001
|
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट टेक्स्ट आउटपुट टेक्स्ट एम्बेड करना |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 2,048 आउटपुट डाइमेंशन का साइज़ 768 |
[**] | रेट की सीमाहर मिनट 1,500 अनुरोध |
अडजस्ट की जा सकने वाली सुरक्षा सेटिंग | काम नहीं करता है |
नया अपडेट | दिसंबर 2023 |
एक्यूए
एक्यूआई मॉडल का इस्तेमाल करके, बेहतर परफ़ॉर्म किया जा सकता है एट्रिब्यूट किए गए सवालों के जवाब (एक्यूए)–किसी दस्तावेज़, कॉर्पस या पैसेज के सेट से जुड़े टास्क. एक्यूए मॉडल ऐसे सवालों के जवाब देता है जो दिए गए सोर्स पर आधारित होते हैं. और जवाब देने की संभावना का अनुमान लगाना.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/aqa |
इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट टेक्स्ट आउटपुट टेक्स्ट |
इस्तेमाल की जा सकने वाली भाषा | अंग्रेज़ी |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 7,168 आउटपुट टोकन की सीमा 1,024 |
[**] | रेट की सीमाहर मिनट 1,500 अनुरोध |
अडजस्ट की जा सकने वाली सुरक्षा सेटिंग | काम करता है |
नया अपडेट | दिसंबर 2023 |
इन मॉडल की क्षमताओं को एक्सप्लोर करने के लिए, उदाहरण देखें अलग-अलग वर्शन.
[*] एक टोकन, Gemini मॉडल के लिए करीब 4 वर्णों के बराबर होता है. 100 टोकन अंग्रेज़ी के करीब 60 से 80 शब्द हैं.
[**] आरपीएम: हर मिनट मिलने वाले अनुरोध
टीपीएम: टोकन प्रति मिनट
आरपीडी: हर दिन मिलने वाले अनुरोध
TPD: टोकन हर दिन
क्षमता की सीमाओं की वजह से, तय की गई ज़्यादा से ज़्यादा दर सीमाएं नहीं हैं
गारंटी के साथ.
मॉडल के वर्शन के नाम के पैटर्न
Gemini के मॉडल, झलक या स्टेबल वर्शन में उपलब्ध हैं. अपने है, तो आप नीचे दिए गए मॉडल नाम फ़ॉर्मैट में से किसी एक का इस्तेमाल करके यह तय कर सकते हैं कि कौनसा मॉडल इस्तेमाल करना है.
सबसे नया: किसी खास मॉडल के सबसे नए वर्शन पर ले जाता है जेनरेशन और वैरिएशन वाली सेटिंग. मौजूदा मॉडल को नियमित रूप से अपडेट किया जाता है. ऐसा करने से इस्तेमाल करें. सिर्फ़ एक्सप्लोरेट्री टेस्टिंग ऐप्लिकेशन और प्रोटोटाइप को इस उपनाम का इस्तेमाल करें.
नया वर्शन तय करने के लिए, नीचे दिए गए पैटर्न का इस्तेमाल करें:
<model>-<generation>-<variation>-latest
. उदाहरण के लिए,gemini-1.0-pro-latest
.नए स्टेबल वर्शन: मॉडल जनरेशन और वैरिएशन वाली सेटिंग तय करें.
नए स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें:
<model>-<generation>-<variation>
. उदाहरण के लिए,gemini-1.0-pro
.स्टेबल: किसी खास स्टेबल मॉडल पर ले जाता है. स्थिर मॉडल में कोई बदलाव नहीं होता. ज़्यादातर प्रोडक्शन ऐप्लिकेशन को, किसी खास स्टेबल मॉडल का इस्तेमाल करना चाहिए.
स्टेबल वर्शन तय करने के लिए, नीचे दिए गए पैटर्न का इस्तेमाल करें:
<model>-<generation>-<variation>-<version>
. उदाहरण के लिए,gemini-1.0-pro-001
.
उपलब्ध भाषाएं
Gemini के मॉडल को इन भाषाओं के साथ काम करने की ट्रेनिंग दी गई है:
- ऐरेबिक (
ar
) - बांग्ला (
bn
) - बल्गेरियन (
bg
) - चीनी सरल और पारंपरिक (
zh
) - क्रोएशियन (
hr
) - चेक (
cs
) - डेनिश (
da
) - डच (
nl
) - अंग्रेज़ी (
en
) - एस्टोनियन (
et
) - फ़िनिश (
fi
) - फ़्रेंच (
fr
) - जर्मन (
de
) - ग्रीक (
el
) - हिब्रू (
iw
) - हिन्दी (
hi
) - हंगेरियन (
hu
) - इंडोनेशियन (
id
) - इटैलियन (
it
) - जैपनीज़ (
ja
) - कोरियन (
ko
) - लातवियन (
lv
) - लिथुएनियन (
lt
) - नॉर्वेजियाई (
no
) - पोलिश (
pl
) - पुर्तगाली (
pt
) - रोमेनियन (
ro
) - रशियन (
ru
) - सर्बियाई (
sr
) - स्लोवाक (
sk
) - स्लोवेनियन (
sl
) - स्पैनिश (
es
) - स्वाहिली (
sw
) - स्वीडिश (
sv
) - थाई (
th
) - टर्किश (
tr
) - यूक्रेनियन (
uk
) - वियतनामीज़ (
vi
)