RecurrentGemma

RecurrentGemma, temel alan tabanlı açık bir modeldir Griffin: kapılı doğrusal yinelemeleri yerel kayan pencere dikkatiyle karıştırır.

Gemma gibi RecurrentGemma da bir metin oluşturma görevleri bulunuyor. Bunların arasında soru yanıtlama, özetleme ve muhakeme. Ancak RecurrentGemma'nın benzersiz mimarisi, aşağıdaki ek özellikleri sunar: avantajları:

  • Düşük bellek gereksinimleri, tek GPU'lar veya CPU'lar gibi sınırlı belleğe sahip cihazlarda daha uzun örnekler oluşturulmasına olanak sağlar.
  • RecurrentGemma, çok daha yüksek grup boyutlarında çıkarım yapabilir, yani özellikle uzun diziler oluştururken saniyede önemli ölçüde daha fazla jeton oluşturabilir.
  • RecurrentGemma, daha az bellek gerektirirken ve daha hızlı çıkarım gerçekleştirirken Gemma'nın performansını eşleştirir.

Daha fazla kaynak

RecurrentGemma'nın model kartı; model, uygulama bilgileri, değerlendirme bilgileri, model kullanımı ile sınırlamaları ve daha fazlası hakkında ayrıntılı bilgiler içerir.
Kaggle'da RecurrentGemma ile ilgili daha fazla kod, Colab not defterleri, bilgi ve tartışmaları görüntüleyin.
GitHub'da JAX ve PyTorch için örnek Colab not defterlerini çalıştırın.