نطاق Gemma
تحليل Gemma 3 باستخدام Gemma Scope 2
Gemma Scope 2 هي مجموعة شاملة ومفتوحة من أدوات التفسير مصمَّمة لمجموعة نماذج Gemma 3. تتيح لك هذه الأداة فحص سلوك الطبقات الفردية. تسمح هذه الأداة للباحثين بتحليل سلوكيات النماذج اللغوية المعقّدة وتصحيح الأخطاء في السلوكيات الناشئة، مثل عمليات الاختراق أو الهلوسة.
تعمل هذه الحزمة كالمجهر للنموذج، إذ توفّر برامج الترميز التلقائي المتفرقة (SAE) وبرامج الترميز التي تم تدريبها على كل طبقة من عائلة Gemma 3.
هل تبحث عن الإصدار السابق؟
ستبقى Gemma Scope الأصلية (لإصدار Gemma 2)
متاحة للباحثين الذين يعملون مع مجموعة نماذج Gemma 2.
-
تقييم سلوك النموذج
استخدِم SAEs وTranscoders لتحليل السلوكيات الداخلية المعقّدة والخوارزميات المتعدّدة الخطوات في Gemma 3. -
أمان روبوت الدردشة وتصحيح الأخطاء
تحليل سلوكيات محددة في المحادثات وآليات الرفض ومدى الالتزام بسلسلة الأفكار من أجل إنشاء وكلاء ذكاء اصطناعي أكثر أمانًا