RecurrentGemma
RecurrentGemma, Griffin पर आधारित एक ओपन मॉडल है. यह एक हाइब्रिड मॉडल है, जो लोकल स्लाइडिंग विंडो अटेंशन के साथ गेट्ड लीनियर दोहराव को मिलाता है.
जेम्मा की तरह, RecurrentGemma टेक्स्ट जनरेट करने के कई तरह के काम आसानी से कर सकते हैं. इनमें सवालों के जवाब देना, खास जानकारी देना, और तर्क देना शामिल है. हालांकि, RecurrentGemma के खास आर्किटेक्चर के कुछ और फ़ायदे भी हैं:
-
कम मेमोरी का इस्तेमाल
कम मेमोरी की ज़रूरत के हिसाब से, कम मेमोरी वाले डिवाइसों पर लंबे सैंपल बनाए जा सकते हैं. जैसे, एक जीपीयू या सीपीयू. -
ज़्यादा थ्रूपुट
RecurrentGemma काफ़ी ज़्यादा बैच साइज़ में अनुमान लगा सकता है. इसका मतलब है कि यह हर सेकंड में काफ़ी ज़्यादा टोकन जनरेट कर सकता है — खास तौर पर लंबे सीक्वेंस जनरेट करते समय. -
बेहतर परफ़ॉर्मेंस
RecurrentGemma, Gemma की परफ़ॉर्मेंस से मैच करता है. इससे, मेमोरी कम होती है और अनुमान आसानी से मिलता है.
ज़्यादा रिसॉर्स
मॉडल कार्ड देखना
RecurrentGemma के मॉडल कार्ड में, मॉडल के बारे में ज़्यादा जानकारी, उसे लागू करने की जानकारी, आकलन की जानकारी, मॉडल के इस्तेमाल और उसकी सीमाओं वगैरह की जानकारी दी गई है.
Kaggle पर देखें
Kaggle पर RecurrentGemma के बारे में ज़्यादा कोड, Colab notebook, जानकारी, और चर्चाएं देखें.
GitHub पर चलाएं
GitHub पर JAX और PyTorch के लिए, Colab notebook के उदाहरण चलाएं.