היקף הרשאות Gemma
ניתוח של Gemma 3 באמצעות Gemma Scope 2
Gemma Scope 2 היא חבילה מקיפה ופתוחה של כלי פרשנות שנועדו לאוסף המודלים Gemma 3. הכלי הזה מאפשר לבחון את ההתנהגות של שכבות ספציפיות. הוא מאפשר לחוקרים לנתח התנהגויות מורכבות של מודלים של שפה ולבצע ניפוי באגים בהתנהגויות מתפתחות כמו פריצות או הזיות.
ערכת הכלים הזו פועלת כמו מיקרוסקופ למודל, ומספקת Sparse Autoencoders (SAEs) וTranscoders שאומנו בכל שכבה של משפחת Gemma 3.
מחפשים את הגרסה הקודמת?
היקף Gemma המקורי (ל-Gemma 2)
עדיין זמין לחוקרים שעובדים עם משפחת המודלים Gemma 2.
-
הערכת התנהגות המודל
אתם יכולים להשתמש ב-SAE ובטרנסקודרים כדי לנתח התנהגויות פנימיות מורכבות ואלגוריתמים מרובי-שלבים ב-Gemma 3. -
בטיחות וניפוי באגים בצ'אטבוט
ניתוח של התנהגויות ספציפיות בצ'אט, מנגנוני סירוב ונאמנות לשרשרת המחשבות, כדי ליצור סוכני AI בטוחים יותר.