RecurrentGemma
RecurrentGemma adalah model terbuka berdasarkan Griffin, arsitektur model campuran yang menggabungkan pengulangan linear terbatas dengan perhatian jendela geser lokal.
Seperti Gemma, RecurrentGemma sangat cocok untuk berbagai tugas pembuatan teks, termasuk menjawab pertanyaan, meringkas, dan menalar. Namun, arsitektur unik RecurrentGemma menawarkan keuntungan tambahan berikut:
-
Pengurangan penggunaan memori
Persyaratan memori yang lebih rendah memungkinkan pembuatan sampel yang lebih panjang di perangkat dengan memori terbatas, seperti GPU atau CPU tunggal. -
Throughput yang lebih tinggi
RecurrentGemma dapat melakukan inferensi pada ukuran batch yang jauh lebih tinggi, yang berarti ia dapat menghasilkan lebih banyak token per detik — terutama saat menghasilkan urutan yang panjang. -
Performa tinggi
RecurrentGemma cocok dengan performa Gemma sekaligus memerlukan lebih sedikit memori dan mencapai inferensi yang lebih cepat.