ShieldGemma

ShieldGemma היא קבוצת מודלים שכווננו לפי הוראות כדי להעריך את הבטיחות של הנחיות הטקסט תגובות פלט טקסט וקלט מול קבוצה של מדיניות בטיחות מוגדרת. אפשר להשתמש המודל הזה הוא חלק מהטמעה נרחבת יותר של אפליקציה של בינה מלאכותית גנרטיבית, לבדוק ולמנוע הפרה של מדיניות הבטיחות באפליקציות של בינה מלאכותית גנרטיבית.

המודלים של ShieldGemma מבוססים על Gemma 2 ב-2B, ב-9B, וגם 27 מיליארד גדלים של פרמטרים. המודל מסופק עם משקולות פתוחות כדי לאפשר לך לבצע כוונון עדין שלו במיוחד למקרה כזה. קבוצת המודלים הזו וקוד ההטמעה לדוגמה רכיב של ערכת כלים אחראית של בינה מלאכותית גנרטיבית.

  • להעריך את הבטיחות של תגובות קלט ופלט להנחיות בהתאם לקבוצה של כללי מדיניות בטיחות מוגדרים.
  • דגמי ShieldGemma מסופקים עם משקולות פתוחות ואפשר לכוונן אותם לפי תרחיש ספציפי לדוגמה שלך.

מידע נוסף

כרטיס המודל של ShieldGemma כולל מידע מפורט על הטמעת המודל, ההערכות שלו, השימוש במודל והמגבלות שלו ועוד.
הצגת קוד נוסף, קובצי notebook של Colab, מידע ודיונים לגבי ShieldGemma ב-Kaggle.
מריצים דוגמת עבודה לשימוש ב-ShieldGemma כדי להעריך את הקלט והפלט של הנחיות טקסט.