1.5 Flash
ज़्यादातर टास्क के लिए बेहतर परफ़ॉर्म करने वाला, हमारा सबसे बेहतरीन मल्टिमोडल मॉडल
- ऑडियो, इमेज, वीडियो, और टेक्स्ट डालें और टेक्स्ट के ज़रिए जवाब पाएं
- कोड जनरेट करना, डेटा निकालना, टेक्स्ट में बदलाव करना वगैरह
- परफ़ॉर्मेंस और लागत को संतुलित करने वाले टास्क के लिए सबसे अच्छा
1.5 Flash-8B
यह हमारा सबसे तेज़ और किफ़ायती मल्टिमोडल मॉडल है. यह बार-बार किए जाने वाले टास्क के लिए बेहतर परफ़ॉर्म करता है
- ऑडियो, इमेज, वीडियो, और टेक्स्ट डालें और टेक्स्ट के ज़रिए जवाब पाएं
- कोड जनरेट करना, डेटा निकालना, टेक्स्ट में बदलाव करना वगैरह
- कम बुद्धिमत्ता वाले और बार-बार होने वाले टास्क के लिए सबसे अच्छा
मॉडल के वैरिएंट
Gemini API, अलग-अलग मॉडल उपलब्ध कराता है. ये मॉडल, इस्तेमाल के खास उदाहरणों के लिए ऑप्टिमाइज़ किए जाते हैं. Gemini के उपलब्ध वैरिएंट के बारे में खास जानकारी यहां दी गई है:
मॉडल का वैरिएंट | इनपुट | आउटपुट | इनके लिए ऑप्टिमाइज़ किया गया |
---|---|---|---|
Gemini 1.5 Flash
gemini-1.5-flash |
ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर परफ़ॉर्मेंस |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | ज़्यादा संख्या में और कम बुद्धिमत्ता वाले टास्क |
Gemini 1.5 Pro
gemini-1.5-pro |
ऑडियो, इमेज, वीडियो, और टेक्स्ट | टेक्स्ट | ऐसे जटिल काम जिनमें ज़्यादा बुद्धिमत्ता की ज़रूरत होती है |
Gemini 1.0 Pro (15/02/2025 को बंद कर दिया गया)
gemini-1.0-pro |
टेक्स्ट | टेक्स्ट | नैचुरल लैंग्वेज के ज़रिए टास्क करने की सुविधा, एक से ज़्यादा बार टेक्स्ट और कोड चैट करने की सुविधा, और कोड जनरेट करने की सुविधा |
टेक्स्ट एम्बेड करना
text-embedding-004 |
टेक्स्ट | टेक्स्ट एम्बेड करना | टेक्स्ट स्ट्रिंग की आपस में मिलती-जुलती होने की डिग्री का आकलन करना |
AQA
aqa |
टेक्स्ट | टेक्स्ट | सवालों के जवाब देने के लिए, सोर्स से मिली जानकारी का इस्तेमाल करना |
Gemini 1.5 Flash
Gemini 1.5 Flash, अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर मल्टीमॉडल मॉडल है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-1.5-flash |
के साथ काम करने वाले डेटा टाइप |
इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 1,048,576 आउटपुट टोकन की सीमा 8,192 |
ऑडियो/विज़ुअल की खास जानकारी |
हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या 3,600 वीडियो की ज़्यादा से ज़्यादा अवधि 1 घंटा ऑडियो की ज़्यादा से ज़्यादा अवधि करीब 9.5 घंटे |
[**] | रेट की सीमाएं
|
की सुविधाएं |
सिस्टम से जुड़े निर्देश काम करता है JSON मोड काम करता है JSON स्कीमा काम करता है सुरक्षा सेटिंग में बदलाव करना काम करता है कैश मेमोरी में सेव होना काम करता है ट्यून करना काम करता है फ़ंक्शन कॉल काम करता है कोड चलाना काम करता है |
वर्शन |
|
का नया अपडेट | सितंबर 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B एक छोटा मॉडल है, जिसे कम बुद्धिमत्ता वाले टास्क के लिए डिज़ाइन किया गया है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-1.5-flash-8b |
के साथ काम करने वाले डेटा टाइप |
इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 1,048,576 आउटपुट टोकन की सीमा 8,192 |
ऑडियो/विज़ुअल की खास जानकारी |
हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या 3,600 वीडियो की ज़्यादा से ज़्यादा अवधि 1 घंटा ऑडियो की ज़्यादा से ज़्यादा अवधि करीब 9.5 घंटे |
[**] | रेट की सीमाएं
|
की सुविधाएं |
सिस्टम से जुड़े निर्देश काम करता है JSON मोड काम करता है JSON स्कीमा काम करता है सुरक्षा सेटिंग में बदलाव करना काम करता है कैश मेमोरी में सेव होना काम करता है ट्यून करना काम करता है फ़ंक्शन कॉल काम करता है कोड चलाना काम करता है |
वर्शन |
|
का नया अपडेट | अक्टूबर 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro, एक मिड-साइज़ वाला मल्टीमोडल मॉडल है. इसे कई तरह के रीज़निंग टास्क के लिए ऑप्टिमाइज़ किया गया है. 1.5 Pro, एक साथ बहुत ज़्यादा डेटा प्रोसेस कर सकता है. जैसे, दो घंटे का वीडियो, 19 घंटे का ऑडियो, 60 हज़ार लाइनों वाला कोडबेस या 2,000 पेजों का टेक्स्ट.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-1.5-pro |
के साथ काम करने वाले डेटा टाइप |
इनपुट ऑडियो, इमेज, वीडियो, और टेक्स्ट आउटपुट टेक्स्ट |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 2,097,152 आउटपुट टोकन की सीमा 8,192 |
ऑडियो/विज़ुअल की खास जानकारी |
हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या 7,200 वीडियो की ज़्यादा से ज़्यादा लंबाई 2 घंटे ऑडियो की ज़्यादा से ज़्यादा अवधि करीब 19 घंटे |
[**] | रेट की सीमाएं
|
की सुविधाएं |
सिस्टम से जुड़े निर्देश काम करता है JSON मोड काम करता है JSON स्कीमा काम करता है सुरक्षा सेटिंग में बदलाव करना काम करता है कैश मेमोरी में सेव होना काम करता है ट्यून करना काम नहीं करता है फ़ंक्शन कॉल काम करता है कोड चलाना काम करता है |
वर्शन |
|
का नया अपडेट | सितंबर 2024 |
Gemini 1.0 Pro (इस्तेमाल नहीं किया जा रहा)
Gemini 1.0 Pro एक एनएलपी मॉडल है. यह कई चरणों वाली टेक्स्ट और कोड चैट के साथ-साथ, कोड जनरेट करने जैसे टास्क को मैनेज करता है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/gemini-1.0-pro |
के साथ काम करने वाले डेटा टाइप |
इनपुट टेक्स्ट आउटपुट टेक्स्ट |
[**] | रेट की सीमाएं
|
की सुविधाएं |
सिस्टम से जुड़े निर्देश काम नहीं करता है JSON मोड काम नहीं करता है JSON स्कीमा काम नहीं करता है सुरक्षा सेटिंग में बदलाव करना काम करता है कैश मेमोरी में सेव होना काम नहीं करता है ट्यून करना काम करता है फ़ंक्शन कॉल काम करता है फ़ंक्शन कॉल करने का कॉन्फ़िगरेशन काम नहीं करता है कोड चलाना काम नहीं करता है |
वर्शन |
|
का नया अपडेट | फ़रवरी 2024 |
टेक्स्ट एम्बेड करना और एम्बेड करना
टेक्स्ट एम्बेड करना
टेक्स्ट एम्बेड का इस्तेमाल, स्ट्रिंग के बीच के संबंध को मेज़र करने के लिए किया जाता है. साथ ही, इनका इस्तेमाल कई एआई ऐप्लिकेशन में किया जाता है.
text-embedding-004
, स्टैंडर्ड MTEB एम्बेडिंग मानदंडों पर, तुलना किए जा सकने वाले डाइमेंशन के साथ बेहतर तरीके से जानकारी को वापस लाता है और मौजूदा मॉडल की तुलना में बेहतर परफ़ॉर्म करता है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड |
Gemini API
|
के साथ काम करने वाले डेटा टाइप |
इनपुट टेक्स्ट आउटपुट टेक्स्ट एम्बेड करना |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 2,048 आउटपुट डाइमेंशन का साइज़ 768 |
[**] | रेट की सीमाएंहर मिनट 1,500 अनुरोध |
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है | काम नहीं करता है |
का नया अपडेट | अप्रैल 2024 |
एम्बेड करना
इनपुट टेक्स्ट के लिए, टेक्स्ट एम्बेड जनरेट करने के लिए, एम्बेड मॉडल का इस्तेमाल किया जा सकता है.
एम्बेडिंग मॉडल को 2,048 टोकन तक के टेक्स्ट के लिए, 768 डाइमेंशन वाले एम्बेड बनाने के लिए ऑप्टिमाइज़ किया गया है.
मॉडल की जानकारी एम्बेड करना
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड |
models/embedding-001
|
के साथ काम करने वाले डेटा टाइप |
इनपुट टेक्स्ट आउटपुट टेक्स्ट एम्बेड करना |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 2,048 आउटपुट डाइमेंशन का साइज़ 768 |
[**] | रेट की सीमाएंहर मिनट 1,500 अनुरोध |
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है | काम नहीं करता है |
का नया अपडेट | दिसंबर 2023 |
AQA
किसी दस्तावेज़, कॉर्पस या पैसेज के सेट पर, एट्रिब्यूट किए गए सवालों के जवाब देने (एक्यूए) से जुड़े टास्क करने के लिए, एक्यूए मॉडल का इस्तेमाल किया जा सकता है. AQA मॉडल, दिए गए सोर्स के आधार पर सवालों के जवाब देता है. साथ ही, जवाब मिलने की संभावना का अनुमान भी लगाता है.
मॉडल का विवरण
प्रॉपर्टी | ब्यौरा |
---|---|
मॉडल कोड | models/aqa |
के साथ काम करने वाले डेटा टाइप |
इनपुट टेक्स्ट आउटपुट टेक्स्ट |
इस्तेमाल की जा सकने वाली भाषा | अंग्रेज़ी |
[*] | टोकन की सीमाएं
इनपुट टोकन की सीमा 7,168 आउटपुट टोकन की सीमा 1,024 |
[**] | रेट की सीमाएंहर मिनट 1,500 अनुरोध |
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है | काम करता है |
का नया अपडेट | दिसंबर 2023 |
मॉडल के इन वैरिएशन की सुविधाओं के बारे में जानने के लिए, उदाहरण देखें.
[*] Gemini मॉडल के लिए, एक टोकन चार वर्णों के बराबर होता है. 100 टोकन, अंग्रेज़ी के करीब 60 से 80 शब्दों के बराबर होते हैं.
[**] आरपीएम: हर मिनट मिलने वाले अनुरोध
टीपीएम: हर मिनट मिलने वाले टोकन
आरपीडी: हर दिन मिलने वाले अनुरोध
टीपीडी: हर दिन मिलने वाले टोकन
क्षमता की सीमाओं की वजह से, तय की गई ज़्यादा से ज़्यादा दर की सीमाओं के मिलने की गारंटी नहीं है.
मॉडल के वर्शन के नाम के पैटर्न
Gemini मॉडल, झलक या स्टैबल वर्शन में उपलब्ध हैं. अपने कोड में, मॉडल के नाम के इनमें से किसी एक फ़ॉर्मैट का इस्तेमाल करके यह बताया जा सकता है कि आपको किस मॉडल और वर्शन का इस्तेमाल करना है.
नया वर्शन: यह किसी खास जनरेशन और वैरिएशन के लिए, मॉडल के सबसे नए वर्शन की जानकारी देता है. बुनियादी मॉडल को नियमित तौर पर अपडेट किया जाता है. यह झलक वाला वर्शन हो सकता है. सिर्फ़ एक्सप्लोरेटिव टेस्टिंग ऐप्लिकेशन और प्रोटोटाइप के लिए, इस उपनाम का इस्तेमाल किया जाना चाहिए.
सबसे नए वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें:
<model>-<generation>-<variation>-latest
. उदाहरण के लिए,gemini-1.0-pro-latest
.सबसे नया स्टेबल वर्शन: यह किसी मॉडल जनरेशन और वैरिएशन के लिए रिलीज़ किए गए सबसे नए स्टेबल वर्शन की जानकारी देता है.
सबसे नए स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें:
<model>-<generation>-<variation>
. उदाहरण के लिए,gemini-1.0-pro
.स्टैबल: किसी खास स्टैबल मॉडल की जानकारी देता है. स्टेबल मॉडल में बदलाव नहीं होता. ज़्यादातर प्रोडक्शन ऐप्लिकेशन को किसी खास स्टेबल मॉडल का इस्तेमाल करना चाहिए.
स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें:
<model>-<generation>-<variation>-<version>
. उदाहरण के लिए,gemini-1.0-pro-001
.एक्सपेरिमेंटल: यह शर्तों में बताए गए एक्सपेरिमेंटल मॉडल पर ले जाता है, जो झलक में उपलब्ध है. इसका मतलब है कि इसे प्रोडक्शन में इस्तेमाल नहीं किया जा सकता. हम एक्सपेरिमेंटल मॉडल रिलीज़ करते हैं, ताकि सुझाव, राय या शिकायतें मिल सकें. साथ ही, डेवलपर को हमारे नए अपडेट जल्द से जल्द मिल सकें और Google में हो रहे इनोवेशन के बारे में जानकारी मिल सके. एक्सपेरिमेंट के तौर पर लॉन्च करने से हमें यह पता चलता है कि मॉडल को बड़े पैमाने पर कैसे रिलीज़ किया जाए. एक्सपेरिमेंटल मॉडल को बिना किसी सूचना के किसी दूसरे मॉडल से बदला जा सकता है. हम इस बात की गारंटी नहीं देते कि एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल, आने वाले समय में एक स्थिर मॉडल बन जाएगा.
एक्सपेरिमेंटल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें:
<model>-<generation>-<variation>-<version>
. उदाहरण के लिए,gemini-exp-1121
.
उपलब्ध भाषाएं
Gemini मॉडल को इन भाषाओं के साथ काम करने के लिए ट्रेन किया गया है:
- ऐरेबिक (
ar
) - बांग्ला (
bn
) - बुल्गेरियन (
bg
) - चाइनीज़ सिम्प्लिफ़ाइड और ट्रेडिशनल (
zh
) - क्रोएशियन (
hr
) - चेक (
cs
) - डेनिश (
da
) - डच (
nl
) - अंग्रेज़ी (
en
) - एस्टोनियन (
et
) - फ़िनिश (
fi
) - फ़्रेंच (
fr
) - जर्मन (
de
) - ग्रीक (
el
) - हिब्रू (
iw
) - हिन्दी (
hi
) - हंगेरियन (
hu
) - इंडोनेशियन (
id
) - इटैलियन (
it
) - जैपनीज़ (
ja
) - कोरियन (
ko
) - लैटवियन (
lv
) - लिथुएनियन (
lt
) - नॉर्वीजन (
no
) - पोलिश (
pl
) - पॉर्चुगीज़ (
pt
) - रोमेनियन (
ro
) - रशियन (
ru
) - सर्बियाई (
sr
) - स्लोवाक (
sk
) - स्लोवेनियन (
sl
) - स्पैनिश (
es
) - स्वाहिली (
sw
) - स्वीडिश (
sv
) - थाई (
th
) - तुर्किश (
tr
) - यूक्रेनियन (
uk
) - वियतनामीज़ (
vi
)