Gemma के ओपन मॉडल
यह लाइटवेट और बेहतरीन ओपन मॉडल है. इसे Gemini मॉडल में इस्तेमाल की गई रिसर्च और तकनीक का इस्तेमाल करके बनाया गया है
Gemma 2 आज़माएं
बेहतर परफ़ॉर्मेंस और बेहतरीन परफ़ॉर्मेंस के लिए फिर से डिज़ाइन किया गया Gemma 2, अलग-अलग हार्डवेयर पर तेज़ी से अनुमान लगाने के लिए ऑप्टिमाइज़ किया गया है.
पांच शॉट
एमएमएलयू
एमएमएलयू बेंचमार्क एक ऐसा टेस्ट है जो प्री-ट्रेनिंग के दौरान, लार्ज लैंग्वेज मॉडल के ज़रिए हासिल किए गए ज्ञान और समस्या हल करने की क्षमता का आकलन करता है.
25-शॉट
ARC-C
ARC-c मानदंड, ARC-e डेटासेट का ज़्यादा फ़ोकस किया गया सबसेट है. इसमें सिर्फ़ ऐसे सवाल शामिल हैं जिनका जवाब, सामान्य (रिट्रीवल-आधारित और शब्द के साथ-साथ होने की संभावना) एल्गोरिदम ने गलत तरीके से दिया है.
पांच शॉट
GSM8K
GSM8K बेंचमार्क, भाषा मॉडल की उस क्षमता की जांच करता है जिससे वह स्कूल के लेवल के मैथ के सवालों को हल कर सकता है. इन सवालों को हल करने के लिए, अक्सर कई चरणों की ज़रूरत होती है.
3-5-शॉट
AGIEval
AGIEval बेंचमार्क, असल दुनिया की परीक्षाओं से मिले सवालों का इस्तेमाल करके, भाषा मॉडल की सामान्य बुद्धि का टेस्ट करता है. ये परीक्षाएं, इंसान की बौद्धिक क्षमताओं का आकलन करने के लिए डिज़ाइन की गई हैं.
तीन शॉट, COT
BBH
BBH (BIG-Bench Hard) बेंचमार्क, उन टास्क पर फ़ोकस करता है जो मौजूदा लैंग्वेज मॉडल के लिए मुश्किल माने जाते हैं. यह अलग-अलग तरह के डोमेन में, तर्क और समझने की क्षमता की जांच करता है.
तीन शॉट, F1
नीचे झुक जाएं
DROP, पढ़ने की समझ का एक मानदंड है. इसमें पैराग्राफ़ के बारे में अलग-अलग तरीके से सोचने की ज़रूरत होती है.
पांच शॉट
Winogrande
Winogrande बेंचमार्क, किसी भाषा मॉडल की क्षमता की जांच करता है. यह जांच यह पता लगाने के लिए की जाती है कि वह खाली जगहों को भरने वाले ऐसे टास्क को हल कर सकता है या नहीं जिनमें दो विकल्प होते हैं. इन टास्क को हल करने के लिए, सामान्य समझ की ज़रूरत होती है.
10-शॉट
HellaSwag
HellaSwag बेंचमार्क, किसी कहानी के सबसे लॉजिकल आखिर को चुनकर, सामान्य समझ की रीज़निंग को समझने और लागू करने की भाषा मॉडल की क्षमता को चुनौती देता है.
4-शॉट
MATH
MATH, किसी भाषा मॉडल की गणित के जटिल सवालों को हल करने की क्षमता का आकलन करता है. इसके लिए, रीज़निंग, कई चरणों में समस्या हल करने, और गणित के कॉन्सेप्ट को समझने की ज़रूरत होती है.
बिना उदाहरण वाला प्रॉम्प्ट
ARC-e
ARC-e बेंचमार्क, भाषा मॉडल की सवालों के जवाब देने की बेहतरीन क्षमताओं की जांच करता है. इसके लिए, यह ग्रेड-स्कूल लेवल के कई विकल्प वाले विज्ञान के सवालों का इस्तेमाल करता है.
बिना उदाहरण वाला प्रॉम्प्ट
PIQA
PIQA बेंचमार्क, किसी भाषा मॉडल की इस क्षमता की जांच करता है कि वह रोज़मर्रा के कामों के बारे में पूछे गए सवालों के जवाब देकर, सामान्य ज्ञान को समझ और लागू कर सकता है या नहीं.
बिना उदाहरण वाला प्रॉम्प्ट
SIQA
SIQA मानदंड, लोगों की कार्रवाइयों और उनके सामाजिक असर के बारे में सवाल पूछकर, यह आकलन करता है कि भाषा मॉडल, सामाजिक इंटरैक्शन और सामाजिक सामान्य समझ को कितना समझता है.
बिना उदाहरण वाला प्रॉम्प्ट
Boolq
BoolQ बेंचमार्क, भाषा के मॉडल की उस क्षमता की जांच करता है जिससे वह आम तौर पर पूछे जाने वाले 'हां/नहीं' सवालों के जवाब दे सकता है. साथ ही, यह मॉडल की उस क्षमता की भी जांच करता है जिससे वह असल ज़िंदगी में, सामान्य भाषा के अनुमान लगाने वाले टास्क को पूरा कर सकता है.
पांच शॉट
TriviaQA
TriviaQA बेंचमार्क, सवाल-जवाब-सबूत के ट्रिपल की मदद से, पढ़कर समझने की क्षमता की जांच करता है.
पांच शॉट
NQ
NQ (Natural Questions) बेंचमार्क, किसी भाषा मॉडल की इस क्षमता की जांच करता है कि वह Wikipedia के पूरे लेखों में जवाब ढूंढकर उन्हें समझ सकता है या नहीं. यह बेंचमार्क, असल ज़िंदगी में सवाल-जवाब के उदाहरणों को सिम्युलेट करता है.
pass@1
HumanEval
HumanEval बेंचमार्क, किसी भाषा मॉडल की कोड जनरेशन क्षमताओं की जांच करता है. इसके लिए, यह जांच की जाती है कि उसके समाधान, प्रोग्रामिंग से जुड़ी समस्याओं के लिए फ़ंक्शनल यूनिट टेस्ट पास करते हैं या नहीं.
तीन शॉट
MBPP
MBPP बेंचमार्क, किसी भाषा मॉडल की Python प्रोग्रामिंग से जुड़ी बुनियादी समस्याओं को हल करने की क्षमता की जांच करता है. यह जांच, प्रोग्रामिंग के बुनियादी सिद्धांतों और स्टैंडर्ड लाइब्रेरी के इस्तेमाल पर फ़ोकस करती है.
100%
75%
50%
25%
0%
100%
75%
50%
25%
0%
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 अरब
Gemma 2
2.6 अरब
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
*ये पहले से ट्रेन किए गए मॉडल के लिए बेंचमार्क हैं. अन्य तरीकों से परफ़ॉर्मेंस के बारे में जानकारी के लिए, तकनीकी रिपोर्ट देखें.
रिसर्च मॉडल
Gemma के अलग-अलग मॉडल के बारे में जानें
Gemmaverse को एक्सप्लोर करना
कम्यूनिटी के बनाए गए Gemma मॉडल और टूल का बड़ा नेटवर्क, जो आपके इनोवेशन को बढ़ावा देने और उसे प्रेरित करने के लिए तैयार है
बनाएं
Gemma की मदद से प्रोजेक्ट बनाना
मॉडल डिप्लॉय करना
डिप्लॉयमेंट का टारगेट चुनना
मोबाइल
Google के एआई एज (डिवाइस पर मौजूद एआई) की मदद से, डिवाइस पर एआई मॉडल को डिप्लॉय करना
कम इंतज़ार और ऑफ़लाइन काम करने की सुविधा के लिए, सीधे डिवाइसों पर डिप्लॉय करें. यह उन ऐप्लिकेशन के लिए सबसे सही है जिन्हें रीयल-टाइम में जवाब देने और निजता की ज़रूरत होती है. जैसे, मोबाइल ऐप्लिकेशन, IoT डिवाइस, और एम्बेड किए गए सिस्टम.
वेब
वेब ऐप्लिकेशन में आसानी से इंटिग्रेट किया जा सकता है
एआई की बेहतर सुविधाओं की मदद से, अपनी वेबसाइटों और वेब सेवाओं को बेहतर बनाएं. इन सुविधाओं की मदद से, इंटरैक्टिव सुविधाएं, उपयोगकर्ताओं के हिसाब से कॉन्टेंट, और बेहतर ऑटोमेशन की सुविधाएं चालू की जा सकती हैं.
क्लाउड
क्लाउड इन्फ़्रास्ट्रक्चर की मदद से, आसानी से स्केल करें
बड़े पैमाने पर डिप्लॉयमेंट, ज़्यादा काम करने वाले वर्कलोड, और एआई के जटिल ऐप्लिकेशन को मैनेज करने के लिए, क्लाउड के स्केले करने की सुविधा और सुविधाओं का फ़ायदा लें.
ग्लोबल कम्यूनिकेशन को अनलॉक करना
हमारे ग्लोबल Kaggle कॉम्पिटीशन में शामिल हों. किसी खास भाषा या संस्कृति के यूनीक पहलू के लिए, Gemma मॉडल के वैरिएंट बनाना