RecurrentGemma

RecurrentGemma एक ओपन मॉडल है, जो ग्रिफ़िन, एक हाइब्रिड मॉडल आर्किटेक्चर है. स्थानीय स्लाइडिंग विंडो पर ध्यान दिए जाने के साथ, गेट की गई लीनियर बार-बार होने वाली वैल्यू को मिलाता है.

जेमा की तरह, RecurrentGemma टेक्स्ट जनरेट करने से जुड़े कई तरह के काम. जैसे, सवाल का जवाब देना, खास जानकारी देना, और रीज़निंग से जुड़े सवालों के जवाब देना. हालांकि, RecurrentGemma की अनोखी संरचना में आपको फ़ायदे:

  • कम मेमोरी की ज़रूरत के हिसाब से, कम मेमोरी वाले डिवाइसों पर लंबे सैंपल बनाए जा सकते हैं. जैसे, एक जीपीयू या सीपीयू.
  • RecurrentGemma काफ़ी ज़्यादा बैच साइज़ में अनुमान लगा सकता है. इसका मतलब है कि यह हर सेकंड में काफ़ी ज़्यादा टोकन जनरेट कर सकता है — खास तौर पर लंबे सीक्वेंस जनरेट करते समय.
  • RecurrentGemma, Gemma की परफ़ॉर्मेंस से मैच करता है. इससे, मेमोरी कम होती है और अनुमान आसानी से मिलता है.

ज़्यादा रिसॉर्स

RecurrentGemma के मॉडल कार्ड में, मॉडल के बारे में ज़्यादा जानकारी, उसे लागू करने की जानकारी, आकलन की जानकारी, मॉडल के इस्तेमाल और उसकी सीमाओं वगैरह की जानकारी दी गई है.
Kaggle पर RecurrentGemma के बारे में ज़्यादा कोड, Colab notebook, जानकारी, और चर्चाएं देखें.
GitHub पर JAX और PyTorch के लिए, Colab notebook के उदाहरण चलाएं.