RecurrentGemma

RecurrentGemma adalah model terbuka yang didasarkan pada Griffin, model campuran yang menggabungkan pengulangan linear terbatas dengan perhatian jendela geser lokal.

Seperti Gemma, RecurrentGemma sangat cocok untuk berbagai tugas pembuatan teks, termasuk menjawab pertanyaan, perangkuman, dan penalaran. Namun, arsitektur unik RecurrentGemma menawarkan keunggulan tambahan berikut:

  • Persyaratan memori yang lebih rendah memungkinkan pembuatan sampel yang lebih panjang di perangkat dengan memori terbatas, seperti GPU atau CPU tunggal.
  • RecurrentGemma dapat melakukan inferensi pada ukuran batch yang jauh lebih tinggi, yang berarti ia dapat menghasilkan lebih banyak token per detik — terutama saat menghasilkan urutan yang panjang.
  • RecurrentGemma cocok dengan performa Gemma sekaligus memerlukan lebih sedikit memori dan mencapai inferensi yang lebih cepat.

Referensi lainnya

Kartu model RecurrentGemma berisi informasi mendetail tentang model, informasi implementasi, informasi evaluasi, penggunaan dan batasan model, serta banyak lagi.
Lihat lebih banyak kode, notebook Colab, informasi, dan diskusi tentang RecurrentGemma di Kaggle.
Jalankan contoh notebook Colab untuk JAX dan PyTorch di GitHub.