Gemini के मॉडल

मॉडल के वैरिएंट

Gemini API, अलग-अलग मॉडल उपलब्ध कराता है. ये मॉडल, इस्तेमाल के खास उदाहरणों के लिए ऑप्टिमाइज़ किए जाते हैं. Gemini के उपलब्ध वैरिएंट के बारे में खास जानकारी यहां दी गई है:

मॉडल का वैरिएंट इनपुट आउटपुट इनके लिए ऑप्टिमाइज़ किया गया
Gemini 1.5 Flash
gemini-1.5-flash
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर परफ़ॉर्मेंस
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट ज़्यादा संख्या में और कम बुद्धिमत्ता वाले टास्क
Gemini 1.5 Pro
gemini-1.5-pro
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट ऐसे जटिल काम जिनमें ज़्यादा बुद्धिमत्ता की ज़रूरत होती है
Gemini 1.0 Pro (15/02/2025 को बंद कर दिया गया)
gemini-1.0-pro
टेक्स्ट टेक्स्ट नैचुरल लैंग्वेज के ज़रिए टास्क करने की सुविधा, एक से ज़्यादा बार टेक्स्ट और कोड चैट करने की सुविधा, और कोड जनरेट करने की सुविधा
टेक्स्ट एम्बेड करना
text-embedding-004
टेक्स्ट टेक्स्ट एम्बेड करना टेक्स्ट स्ट्रिंग की आपस में मिलती-जुलती होने की डिग्री का आकलन करना
AQA
aqa
टेक्स्ट टेक्स्ट सवालों के जवाब देने के लिए, सोर्स से मिली जानकारी का इस्तेमाल करना

Gemini 1.5 Flash

Gemini 1.5 Flash, अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर मल्टीमॉडल मॉडल है.

AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.5-flash
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

1,048,576

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की खास जानकारी

हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या

3,600

वीडियो की ज़्यादा से ज़्यादा लंबाई

1 घंटा

ऑडियो की ज़्यादा से ज़्यादा अवधि

करीब 9.5 घंटे

रेट की सीमाएं[**]
बिना किसी शुल्क के:
  • 15 आरपीएम
  • 10 लाख टीपीएम
  • 1,500 पेरूवियन सोल
Pay-as-you-go:
  • 2,000 आरपीएम
  • 40 लाख टीपीएम
की सुविधाएं

सिस्टम से जुड़े निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम करता है

सुरक्षा सेटिंग में बदलाव करना

काम करता है

कैश मेमोरी में सेव होना

काम करता है

ट्यून करना

काम करता है

फ़ंक्शन कॉल

काम करता है

कोड चलाना

काम करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
का नया अपडेट सितंबर 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B एक छोटा मॉडल है, जिसे कम बुद्धि वाले टास्क के लिए डिज़ाइन किया गया है.

AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.5-flash-8b
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

1,048,576

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की खास जानकारी

हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या

3,600

वीडियो की ज़्यादा से ज़्यादा लंबाई

1 घंटा

ऑडियो की ज़्यादा से ज़्यादा अवधि

करीब 9.5 घंटे

रेट की सीमाएं[**]
बिना किसी शुल्क के:
  • 15 आरपीएम
  • 10 लाख टीपीएम
  • 1,500 पेरूवियन सोल
Pay-as-you-go:
  • 4,000 आरपीएम
  • 40 लाख टीपीएम
की सुविधाएं

सिस्टम से जुड़े निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम करता है

सुरक्षा सेटिंग में बदलाव करना

काम करता है

कैश मेमोरी में सेव होना

काम करता है

ट्यून करना

काम करता है

फ़ंक्शन कॉल

काम करता है

कोड चलाना

काम करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
  • नया: gemini-1.5-flash-8b-latest
  • सबसे नया स्टेबल वर्शन: gemini-1.5-flash-8b
  • स्थिर:
    • gemini-1.5-flash-8b-001
का नया अपडेट अक्टूबर 2024

Gemini 1.5 Pro

Gemini 1.5 Pro, एक मिड-साइज़ वाला मल्टीमोडल मॉडल है. इसे कई तरह के रीज़निंग टास्क के लिए ऑप्टिमाइज़ किया गया है. 1.5 Pro, एक साथ बहुत ज़्यादा डेटा प्रोसेस कर सकता है. जैसे, दो घंटे का वीडियो, 19 घंटे का ऑडियो,60, 000 लाइनों वाला कोडबेस या 2,000 पेजों का टेक्स्ट.

AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.5-pro
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,097,152

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की खास जानकारी

हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या

7,200

वीडियो की ज़्यादा से ज़्यादा लंबाई

2 घंटे

ऑडियो की ज़्यादा से ज़्यादा अवधि

करीब 19 घंटे

रेट की सीमाएं[**]
बिना शुल्क के:
  • 2 आरपीएम
  • 32,000 टीपीएम
  • 50 पेरूवियन सोल
Pay-as-you-go:
  • 1,000 आरपीएम
  • 40 लाख टीपीएम
की सुविधाएं

सिस्टम से जुड़े निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम करता है

सुरक्षा सेटिंग में बदलाव करना

काम करता है

कैश मेमोरी में सेव होना

काम करता है

ट्यून करना

काम नहीं करता है

फ़ंक्शन कॉल

काम करता है

कोड चलाना

काम करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
का नया अपडेट सितंबर 2024

Gemini 1.0 Pro (इस्तेमाल नहीं किया जा रहा)

Gemini 1.0 Pro एक एनएलपी मॉडल है. यह कई चरणों वाली टेक्स्ट और कोड चैट के साथ-साथ, कोड जनरेट करने जैसे टास्क को मैनेज करता है.

AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.0-pro
के साथ काम करने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट

रेट की सीमाएं[**]
बिना किसी शुल्क के:
  • 15 आरपीएम
  • 32,000 टीपीएम
  • 1,500 पेरूवियन सोल
Pay-as-you-go:
  • 360 RPM
  • 1,20,000 टीपीएम
  • 30,000 पश्चिम पापुआ न्यू गिनियन किना
की सुविधाएं

सिस्टम से जुड़े निर्देश

काम नहीं करता है

JSON मोड

काम नहीं करता है

JSON स्कीमा

काम नहीं करता है

सुरक्षा सेटिंग में बदलाव करना

काम करता है

कैश मेमोरी में सेव होना

काम नहीं करता है

ट्यून करना

काम करता है

फ़ंक्शन कॉल

काम करता है

फ़ंक्शन कॉल करने का कॉन्फ़िगरेशन

काम नहीं करता है

कोड चलाना

काम नहीं करता है

वर्शन
  • नया: gemini-1.0-pro-latest
  • सबसे नया स्टेबल वर्शन: gemini-1.0-pro
  • स्थिर: gemini-1.0-pro-001
का नया अपडेट फ़रवरी 2024

टेक्स्ट एम्बेड करना और एम्बेड करना

टेक्स्ट एम्बेड करना

टेक्स्ट एम्बेड का इस्तेमाल, स्ट्रिंग के बीच के संबंध को मेज़र करने के लिए किया जाता है. साथ ही, इनका इस्तेमाल कई एआई ऐप्लिकेशन में किया जाता है.

text-embedding-004, स्टैंडर्ड MTEB एम्बेडिंग मानदंडों पर, तुलना किए जा सकने वाले डाइमेंशन के साथ बेहतर तरीके से जानकारी को वापस लाता है और मौजूदा मॉडल की तुलना में बेहतर परफ़ॉर्म करता है.

मॉडल का विवरण
प्रॉपर्टी ब्यौरा
मॉडल कोड

Gemini API

models/text-embedding-004

के साथ काम करने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट एम्बेड करना

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,048

आउटपुट डाइमेंशन का साइज़

768

रेट की सीमाएं[**] हर मिनट 1,500 अनुरोध
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है काम नहीं करता है
का नया अपडेट अप्रैल 2024

एम्बेड करना

इनपुट टेक्स्ट के लिए, टेक्स्ट एम्बेड जनरेट करने के लिए, एम्बेड मॉडल का इस्तेमाल किया जा सकता है.

एम्बेडिंग मॉडल को 2,048 टोकन तक के टेक्स्ट के लिए, 768 डाइमेंशन वाले एम्बेड बनाने के लिए ऑप्टिमाइज़ किया गया है.

मॉडल की जानकारी एम्बेड करना
प्रॉपर्टी ब्यौरा
मॉडल कोड models/embedding-001
के साथ काम करने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट एम्बेड करना

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,048

आउटपुट डाइमेंशन का साइज़

768

रेट की सीमाएं[**] हर मिनट 1,500 अनुरोध
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है काम नहीं करता है
का नया अपडेट दिसंबर 2023

AQA

किसी दस्तावेज़, कॉर्पस या पैसेज के सेट पर, एट्रिब्यूट किए गए सवालों के जवाब देने (एक्यूए) से जुड़े टास्क करने के लिए, एक्यूए मॉडल का इस्तेमाल किया जा सकता है. AQA मॉडल, दिए गए सोर्स के आधार पर सवालों के जवाब देता है. साथ ही, जवाब मिलने की संभावना का अनुमान भी लगाता है.

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/aqa
के साथ काम करने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट

इस्तेमाल की जा सकने वाली भाषा अंग्रेज़ी
टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

7,168

आउटपुट टोकन की सीमा

1,024

रेट की सीमाएं[**] हर मिनट 1,500 अनुरोध
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है काम करता है
का नया अपडेट दिसंबर 2023

मॉडल के इन वैरिएशन की सुविधाओं के बारे में जानने के लिए, उदाहरण देखें.

[*] Gemini मॉडल के लिए, एक टोकन चार वर्णों के बराबर होता है. 100 टोकन, अंग्रेज़ी के करीब 60 से 80 शब्दों के बराबर होते हैं.

[**] आरपीएम: हर मिनट के अनुरोध
टीपीएम: हर मिनट के टोकन
आरपीडी: हर दिन के अनुरोध
टीपीडी: हर दिन के टोकन

क्षमता की सीमाओं की वजह से, तय की गई ज़्यादा से ज़्यादा दर की सीमाओं की गारंटी नहीं दी जाती.

मॉडल के वर्शन के नाम के पैटर्न

Gemini मॉडल, झलक या स्टैबल वर्शन में उपलब्ध हैं. अपने कोड में, मॉडल के नाम के इनमें से किसी एक फ़ॉर्मैट का इस्तेमाल करके यह बताया जा सकता है कि आपको किस मॉडल और वर्शन का इस्तेमाल करना है.

  • नया वर्शन: यह किसी खास जनरेशन और वैरिएशन के लिए, मॉडल के सबसे नए वर्शन की जानकारी देता है. बुनियादी मॉडल को नियमित तौर पर अपडेट किया जाता है. यह झलक वाला वर्शन हो सकता है. सिर्फ़ एक्सप्लोरेटिव टेस्टिंग ऐप्लिकेशन और प्रोटोटाइप के लिए, इस उपनाम का इस्तेमाल किया जाना चाहिए.

    सबसे नए वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-latest. उदाहरण के लिए, gemini-1.0-pro-latest.

  • सबसे नया स्टेबल वर्शन: यह किसी मॉडल जनरेशन और वैरिएशन के लिए रिलीज़ किए गए सबसे नए स्टेबल वर्शन की जानकारी देता है.

    सबसे नए स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>. उदाहरण के लिए, gemini-1.0-pro.

  • स्टैबल: किसी खास स्टैबल मॉडल की जानकारी देता है. स्टेबल मॉडल में बदलाव नहीं होता. ज़्यादातर प्रोडक्शन ऐप्लिकेशन को किसी खास स्टेबल मॉडल का इस्तेमाल करना चाहिए.

    स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-<version>. उदाहरण के लिए, gemini-1.0-pro-001.

  • एक्सपेरिमेंटल: यह शर्तों में बताए गए एक्सपेरिमेंटल मॉडल पर ले जाता है, जो झलक में उपलब्ध है. इसका मतलब है कि इसे प्रोडक्शन में इस्तेमाल नहीं किया जा सकता. हम एक्सपेरिमेंटल मॉडल रिलीज़ करते हैं, ताकि सुझाव, राय या शिकायतें मिल सकें. साथ ही, डेवलपर को हमारे नए अपडेट जल्द से जल्द मिल सकें और Google में हो रहे इनोवेशन की जानकारी मिल सके. एक्सपेरिमेंट के तौर पर लॉन्च करने से हमें जो जानकारी मिलती है उससे हमें यह तय करने में मदद मिलती है कि मॉडल को बड़े पैमाने पर कैसे रिलीज़ किया जाए. एक्सपेरिमेंटल मॉडल को बिना किसी सूचना के किसी दूसरे मॉडल से बदला जा सकता है. हम इस बात की गारंटी नहीं देते कि एक्सपेरिमेंटल मॉडल, आने वाले समय में स्थिर मॉडल बन जाएगा.

    एक्सपेरिमेंटल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-<version>. उदाहरण के लिए, gemini-1.5-pro-exp-0827.

उपलब्ध भाषाएं

Gemini मॉडल को इन भाषाओं के साथ काम करने के लिए ट्रेन किया गया है:

  • ऐरेबिक (ar)
  • बांग्ला (bn)
  • बुल्गेरियन (bg)
  • चाइनीज़ सिम्प्लिफ़ाइड और ट्रेडिशनल (zh)
  • क्रोएशियन (hr)
  • चेक (cs)
  • डेनिश (da)
  • डच (nl)
  • अंग्रेज़ी (en)
  • एस्टोनियन (et)
  • फ़िनिश (fi)
  • फ़्रेंच (fr)
  • जर्मन (de)
  • ग्रीक (el)
  • हिब्रू (iw)
  • हिन्दी (hi)
  • हंगेरियन (hu)
  • इंडोनेशियन (id)
  • इटैलियन (it)
  • जैपनीज़ (ja)
  • कोरियन (ko)
  • लैटवियन (lv)
  • लिथुएनियन (lt)
  • नॉर्वीजन (no)
  • पोलिश (pl)
  • पॉर्चुगीज़ (pt)
  • रोमेनियन (ro)
  • रशियन (ru)
  • सर्बियाई (sr)
  • स्लोवाक (sk)
  • स्लोवेनियन (sl)
  • स्पैनिश (es)
  • स्वाहिली (sw)
  • स्वीडिश (sv)
  • थाई (th)
  • तुर्किश (tr)
  • यूक्रेनियन (uk)
  • वियतनामीज़ (vi)