RecurrentGemma
RecurrentGemma adalah model terbuka berdasarkan Griffin, arsitektur model hybrid yang menggabungkan pengulangan linear bergerbang dengan jendela geser lokal.
Seperti Gemma, RecurrentGemma sangat cocok untuk berbagai tugas pembuatan teks, termasuk menjawab pertanyaan, meringkas, dan penalaran. Namun, arsitektur unik RecurrentGemma menawarkan kemampuan tambahan kelebihan:
-
Pengurangan penggunaan memori
Persyaratan memori yang lebih rendah memungkinkan pembuatan sampel yang lebih panjang di perangkat dengan memori terbatas, seperti GPU atau CPU tunggal. -
Throughput yang lebih tinggi
RecurrentGemma dapat melakukan inferensi pada ukuran batch yang jauh lebih tinggi, yang berarti ia dapat menghasilkan lebih banyak token per detik — terutama saat menghasilkan urutan yang panjang. -
Performa tinggi
RecurrentGemma cocok dengan performa Gemma sekaligus memerlukan lebih sedikit memori dan mencapai inferensi yang lebih cepat.