Cakupan Gemma
Menganalisis Gemma 3 dengan Gemma Scope 2
Gemma Scope 2 adalah rangkaian alat interpretasi terbuka dan komprehensif yang dirancang untuk koleksi model Gemma 3. Alat ini memungkinkan Anda memeriksa perilaku setiap lapisan. Hal ini memungkinkan peneliti menganalisis perilaku model bahasa yang kompleks dan men-debug perilaku yang muncul seperti pelarian dari batasan atau halusinasi.
Toolkit ini berfungsi sebagai mikroskop untuk model, yang menyediakan Sparse Autoencoders (SAEs) dan Transcoder yang dilatih di setiap lapisan keluarga Gemma 3.
Mencari versi sebelumnya?
Cakupan Gemma asli (untuk Gemma 2)
tetap tersedia bagi peneliti yang menggunakan rangkaian model Gemma 2.
-
Evaluasi perilaku model
Gunakan SAE dan Transcoder untuk menganalisis perilaku internal yang kompleks dan algoritma multi-langkah di Gemma 3. -
Keamanan & penelusuran kesalahan chatbot
Menganalisis perilaku chat tertentu, mekanisme penolakan, dan kesetiaan rantai pemikiran untuk membangun agen AI yang lebih aman.