RecurrentGemma

RecurrentGemma, Griffin पर आधारित एक ओपन मॉडल है. यह एक हाइब्रिड मॉडल है, जो लोकल स्लाइडिंग विंडो अटेंशन के साथ गेट्ड लीनियर दोहराव को मिलाता है.

जेम्मा की तरह, RecurrentGemma टेक्स्ट जनरेट करने के कई तरह के काम आसानी से कर सकते हैं. इनमें सवालों के जवाब देना, खास जानकारी देना, और तर्क देना शामिल है. हालांकि, RecurrentGemma के खास आर्किटेक्चर के कुछ और फ़ायदे भी हैं:

  • कम मेमोरी की ज़रूरत के हिसाब से, कम मेमोरी वाले डिवाइसों पर लंबे सैंपल बनाए जा सकते हैं. जैसे, एक जीपीयू या सीपीयू.
  • RecurrentGemma काफ़ी ज़्यादा बैच साइज़ में अनुमान लगा सकता है. इसका मतलब है कि यह हर सेकंड में काफ़ी ज़्यादा टोकन जनरेट कर सकता है — खास तौर पर लंबे सीक्वेंस जनरेट करते समय.
  • RecurrentGemma, Gemma की परफ़ॉर्मेंस से मैच करता है. इससे, मेमोरी कम होती है और अनुमान आसानी से मिलता है.

ज़्यादा रिसॉर्स

RecurrentGemma के मॉडल कार्ड में, मॉडल के बारे में ज़्यादा जानकारी, उसे लागू करने की जानकारी, आकलन की जानकारी, मॉडल के इस्तेमाल और उसकी सीमाओं वगैरह की जानकारी दी गई है.
Kaggle पर RecurrentGemma के बारे में ज़्यादा कोड, Colab notebook, जानकारी, और चर्चाएं देखें.
GitHub पर JAX और PyTorch के लिए, Colab notebook के उदाहरण चलाएं.