Cakupan Gemma

Menganalisis Gemma 3 dengan Gemma Scope 2

Gemma Scope 2 adalah rangkaian alat interpretasi terbuka dan komprehensif yang dirancang untuk koleksi model Gemma 3. Alat ini memungkinkan Anda memeriksa perilaku setiap lapisan. Hal ini memungkinkan peneliti menganalisis perilaku model bahasa yang kompleks dan men-debug perilaku yang muncul seperti pelarian dari batasan atau halusinasi.

Toolkit ini berfungsi sebagai mikroskop untuk model, yang menyediakan Sparse Autoencoders (SAEs) dan Transcoder yang dilatih di setiap lapisan keluarga Gemma 3.

Mencari versi sebelumnya?
Cakupan Gemma asli (untuk Gemma 2) tetap tersedia bagi peneliti yang menggunakan rangkaian model Gemma 2.

  • Gunakan SAE dan Transcoder untuk menganalisis perilaku internal yang kompleks dan algoritma multi-langkah di Gemma 3.
  • Menganalisis perilaku chat tertentu, mekanisme penolakan, dan kesetiaan rantai pemikiran untuk membangun agen AI yang lebih aman.

Pelajari lebih lanjut

Baca tentang arsitektur, data pelatihan, dan kemampuan baru Gemma Scope 2.
Akses bobot, kode, dan dokumentasi untuk rangkaian kemampuan interpretasi Gemma 3.
Coba tutorial interaktif untuk memvisualisasikan fitur dan mengubah perilaku model.
Akses blog dan resource untuk Gemma Scope asli untuk Gemma 2.