ניפוי באגים באמצעות הנחיה באמצעות LIT

כל גישה אחראית לשימוש בבינה מלאכותית (AI) צריכה לכלול מדיניות בטיחות, אמצעי שקיפות ואמצעי הגנה, אבל שימוש אחראי ב-AI הוא לא רק ביצוע של רשימות משימות.

מוצרי ה-GenAI הם חדשים יחסית, וההתנהגות של אפליקציה יכולה להשתנות יותר מאשר בתוכנות קודמות. לכן, כדאי לבדוק את המודלים שבהם אתם משתמשים כדי לבחון דוגמאות להתנהגות של המודל, ולחקור תוצאות מפתיעות.

הנחיות הן הממשק הנפוץ ביותר לאינטראקציה עם GenAI, ופיתוח ההנחיות הוא תהליך שמכיל גם אומנות וגם מדע. עם זאת, יש כלים שיכולים לעזור לכם לשפר באופן אמפירי את ההנחיות ל-LLM, כמו Learning Interpretability Tool‏ (LIT). LIT הוא כלי בקוד פתוח להבנה חזותית של מודלים של AI ולניפוי באגים, ואפשר להשתמש בהם כלי לניפוי באגים לעבודה של הנדסת הנחיות. עוקבים לפי המדריך שסופק באמצעות Colab או Codelab.

ניתוח מודלים של Gemma באמצעות LIT

התחלת Codelab הפעלת Google Colab

אנימציה של ממשק המשתמש של כלי הפרשנות הלימודית (LIT)

איור 1. ממשק המשתמש של LIT: הכלי לעריכת נקודות נתונים בחלק העליון מאפשר למשתמשים לערוך את ההנחיות שלהם. בחלק התחתון, מודול LM Salience מאפשר כדי לבדוק את תוצאות הבולטות.

אפשר להשתמש ב-LIT במכונה המקומית, Colab או ב-Google Cloud.

כדאי לכלול צוותים לא טכניים בבדיקה ובניתוח של המודל

היכולת להבין את המשמעות היא עבודת צוות, והיא מתפרסת על פני המומחיות המדיניות המשפטית ועוד. האמצעים החזותיים והיכולת האינטראקטיבית של LIT לבחון בולטות ועיון דוגמאות יכולות לעזור לבעלי עניין שונים לשתף להסביר את הממצאים. הגישה הזו מאפשרת מגוון רחב יותר של נקודות מבט בניתוח, בבדיקה ובניפוי הבאגים של המודלים. חשיפת חברי הצוות שלכם לשינויים האלה שיטות טכניות יכולות לשפר את ההבנה שלהם לגבי אופן הפעולה של המודלים. לחשבון גם מומחיות מגוונת יותר בבדיקות מודלים מוקדמות יכולה לעזור חושפים תוצאות לא רצויות שאפשר לשפר.