RecurrentGemma

RecurrentGemma adalah model terbuka berdasarkan Griffin, arsitektur model hybrid yang menggabungkan pengulangan linear bergerbang dengan jendela geser lokal.

Seperti Gemma, RecurrentGemma sangat cocok untuk berbagai tugas pembuatan teks, termasuk menjawab pertanyaan, meringkas, dan penalaran. Namun, arsitektur unik RecurrentGemma menawarkan kemampuan tambahan kelebihan:

  • Persyaratan memori yang lebih rendah memungkinkan pembuatan sampel yang lebih panjang di perangkat dengan memori terbatas, seperti GPU atau CPU tunggal.
  • RecurrentGemma dapat melakukan inferensi pada ukuran batch yang jauh lebih tinggi, yang berarti ia dapat menghasilkan lebih banyak token per detik — terutama saat menghasilkan urutan yang panjang.
  • RecurrentGemma cocok dengan performa Gemma sekaligus memerlukan lebih sedikit memori dan mencapai inferensi yang lebih cepat.

Referensi lainnya

Kartu model RecurrentGemma berisi informasi mendetail tentang model, informasi implementasi, informasi evaluasi, penggunaan dan batasan model, serta banyak lagi.
Lihat lebih banyak kode, notebook Colab, informasi, dan diskusi tentang RecurrentGemma di Kaggle.
Jalankan contoh notebook Colab untuk JAX dan PyTorch di GitHub.