ערכת הכלים הזו מספקת משאבים וכלים ליישום שיטות מומלצות לשימוש אחראי במודלים פתוחים, כמו Gemma, כולל:
- הנחיות להגדרת מדיניות בטיחות, כוונון בטיחות, מסווגי בטיחות והערכת מודלים.
- הכלי 'חיזוי תוצאות למידה' (LIT) לבדיקה ולבדיקה ניפוי באגים בהתנהגות של Gemma בתגובה להנחיות.
- השוואה מסוג LLM כדי לבדוק ניפוי באגים בהתנהגות של Gemma בתגובה להנחיות.
- מתודולוגיה לפיתוח מסווגי בטיחות חזקים באמצעות דוגמאות מינימליות.
הגרסה הזו של ערכת הכלים מתמקדת רק במודלים של טקסט לטקסט באנגלית. שלך נוכל לשלוח משוב כדי לשפר את ערכת הכלים הזו בתחתית הדף.
כשבונים באמצעות Gemma, צריך לנקוט גישה הוליסטית לגבי אחריות ולשקול את כל האתגרים האפשריים ברמת האפליקציה והמודל. ערכת הכלים הזו עוסקת בשיטות התמודדות עם סיכונים וצמצום הבעיה בבטיחות, בפרטיות הוגנות ואחריותיות.
למידע נוסף ולהנחיות, כדאי לבדוק את שאר ערכת הכלים הזו: