RecurrentGemma
RecurrentGemma एक खुला मॉडल है, जो Griffin पर आधारित है. यह एक हाइब्रिड मॉडल आर्किटेक्चर है. यह स्थानीय स्लाइडिंग विंडो अटेंशन के साथ गेट किए गए लीनियर बार-बार होने वाले दोहराव को मिलाता है.
जेमा की तरह, RecurrentGemma भी टेक्स्ट जनरेट करने से जुड़े कई तरह के काम करने में माहिर है. जैसे, सवालों का जवाब देना, ख़ास जानकारी देना, और रीज़निंग से जुड़े सवालों के जवाब देना. हालांकि, RecurrentGemma के खास आर्किटेक्चर के ये अतिरिक्त फ़ायदे हैं:
-
कम मेमोरी का इस्तेमाल
कम मेमोरी की ज़रूरत के हिसाब से, कम मेमोरी वाले डिवाइसों पर लंबे सैंपल बनाए जा सकते हैं. जैसे, एक जीपीयू या सीपीयू. -
ज़्यादा थ्रूपुट
RecurrentGemma काफ़ी ज़्यादा बैच साइज़ में अनुमान लगा सकता है. इसका मतलब है कि यह हर सेकंड में काफ़ी ज़्यादा टोकन जनरेट कर सकता है — खास तौर पर लंबे सीक्वेंस जनरेट करते समय. -
बेहतर परफ़ॉर्मेंस
RecurrentGemma, Gemma की परफ़ॉर्मेंस से मैच करता है. इससे, मेमोरी कम होती है और अनुमान आसानी से मिलता है.