RecurrentGemma

RecurrentGemma, kontrollü doğrusal yinelemeleri yerel kayan pencere dikkatiyle birleştiren karma bir model olan Griffin'i temel alan açık bir modeldir.

Gemma gibi RecurrentGemma da soru yanıtlama, özetleme ve akıl yürütme gibi çeşitli metin oluşturma görevleri için uygundur. Bununla birlikte, RecurrentGemma'nın benzersiz mimarisi şu ek avantajları sunar:

  • Düşük bellek gereksinimleri, tek GPU'lar veya CPU'lar gibi sınırlı belleğe sahip cihazlarda daha uzun örnekler oluşturulmasına olanak sağlar.
  • RecurrentGemma, çok daha yüksek grup boyutlarında çıkarım yapabilir, yani özellikle uzun diziler oluştururken saniyede önemli ölçüde daha fazla jeton oluşturabilir.
  • RecurrentGemma, daha az bellek gerektirirken ve daha hızlı çıkarım gerçekleştirirken Gemma'nın performansını eşleştirir.

Daha fazla kaynak

RecurrentGemma'nın model kartı; model, uygulama bilgileri, değerlendirme bilgileri, model kullanımı ile sınırlamaları ve daha fazlası hakkında ayrıntılı bilgiler içerir.
Kaggle'da RecurrentGemma ile ilgili daha fazla kod, Colab not defterleri, bilgi ve tartışmaları görüntüleyin.
GitHub'da JAX ve PyTorch için örnek Colab not defterlerini çalıştırın.