ขอบเขตของ Gemma

วิเคราะห์ Gemma 3 ด้วย Gemma Scope 2

Gemma Scope 2 เป็นชุดเครื่องมือแบบเปิดที่ครอบคลุมสำหรับการตีความ ซึ่งออกแบบมาสำหรับคอลเล็กชันโมเดล Gemma 3 เครื่องมือนี้ช่วยให้คุณตรวจสอบลักษณะการทำงานของเลเยอร์แต่ละเลเยอร์ได้ ซึ่งช่วยให้นักวิจัยวิเคราะห์พฤติกรรมของโมเดลภาษาที่ซับซ้อนและ แก้ไขข้อบกพร่องของพฤติกรรมที่เกิดขึ้นใหม่ เช่น การหลบเลี่ยงข้อจำกัดหรือการหลอนได้

ชุดเครื่องมือนี้ทำหน้าที่เป็นกล้องจุลทรรศน์สำหรับโมเดล โดยมี Sparse Autoencoders (SAE) และ Transcoders ที่ฝึกในทุกเลเยอร์ของตระกูล Gemma 3

หากกำลังมองหาเวอร์ชันก่อนหน้า
ขอบเขตของ Gemma (สำหรับ Gemma 2) เวอร์ชันเดิมจะยังคงพร้อมให้บริการสำหรับนักวิจัยที่ทำงานกับโมเดลตระกูล Gemma 2

  • ใช้ SAE และ Transcoder เพื่อวิเคราะห์ลักษณะการทำงานภายในที่ซับซ้อนและอัลกอริทึมแบบหลายขั้นตอนใน Gemma 3
  • วิเคราะห์ลักษณะการแชท กลไกการปฏิเสธ และความถูกต้องของเชนออฟธ็อตที่เฉพาะเจาะจงเพื่อสร้างเอเจนต์ AI ที่ปลอดภัยยิ่งขึ้น

ดูข้อมูลเพิ่มเติม

อ่านเกี่ยวกับสถาปัตยกรรมใหม่ ข้อมูลการฝึก และความสามารถของ Gemma Scope 2
เข้าถึงน้ำหนัก โค้ด และเอกสารประกอบสำหรับชุดเครื่องมือการตีความ Gemma 3
ลองใช้บทแนะนำแบบอินเทอร์แอกทีฟเพื่อแสดงภาพฟีเจอร์และแก้ไขลักษณะการทำงานของโมเดล
เข้าถึงบล็อกและแหล่งข้อมูลสำหรับ Gemma Scope เวอร์ชันเดิมสำหรับ Gemma 2