ขอบเขตของ Gemma
วิเคราะห์ Gemma 3 ด้วย Gemma Scope 2
Gemma Scope 2 เป็นชุดเครื่องมือแบบเปิดที่ครอบคลุมสำหรับการตีความ ซึ่งออกแบบมาสำหรับคอลเล็กชันโมเดล Gemma 3 เครื่องมือนี้ช่วยให้คุณตรวจสอบลักษณะการทำงานของเลเยอร์แต่ละเลเยอร์ได้ ซึ่งช่วยให้นักวิจัยวิเคราะห์พฤติกรรมของโมเดลภาษาที่ซับซ้อนและ แก้ไขข้อบกพร่องของพฤติกรรมที่เกิดขึ้นใหม่ เช่น การหลบเลี่ยงข้อจำกัดหรือการหลอนได้
ชุดเครื่องมือนี้ทำหน้าที่เป็นกล้องจุลทรรศน์สำหรับโมเดล โดยมี Sparse Autoencoders (SAE) และ Transcoders ที่ฝึกในทุกเลเยอร์ของตระกูล Gemma 3
หากกำลังมองหาเวอร์ชันก่อนหน้า
ขอบเขตของ Gemma (สำหรับ Gemma 2)
เวอร์ชันเดิมจะยังคงพร้อมให้บริการสำหรับนักวิจัยที่ทำงานกับโมเดลตระกูล Gemma 2
-
การประเมินพฤติกรรมของโมเดล
ใช้ SAE และ Transcoder เพื่อวิเคราะห์ลักษณะการทำงานภายในที่ซับซ้อนและอัลกอริทึมแบบหลายขั้นตอนใน Gemma 3 -
ความปลอดภัยและการแก้ไขข้อบกพร่องของแชทบ็อต
วิเคราะห์ลักษณะการแชท กลไกการปฏิเสธ และความถูกต้องของเชนออฟธ็อตที่เฉพาะเจาะจงเพื่อสร้างเอเจนต์ AI ที่ปลอดภัยยิ่งขึ้น