ערכת כלים של בינה מלאכותית גנרטיבית ואחראית
כלים והנחיות לתכנון, לפיתוח ולהערכה של מודלים פתוחים של AI באופן אחראי.
תכנון אפליקציה אחראי
תוכלו להגדיר כללים להתנהגות של המודל, ליצור אפליקציה בטוחה ואמינה ולנהל תקשורת שקופה עם המשתמשים.
יישור בטיחות
תלמדו על שיטות לניפוי באגים בהנחיות והנחיות לכוונון עדין ול-RLHF כדי להתאים מודלים של AI למדיניות בנושא בטיחות.
הערכת המודל
בעזרת כלי ההשוואה של LLM, אפשר למצוא הנחיות ונתונים לביצוע הערכה יעילה של המודל בנוגע לבטיחות, הוגנות ועובדות.
אמצעי הגנה
פריסה של מסווגי בטיחות, שימוש בפתרונות מוכנים או בנייה של מסווגי בטיחות באמצעות מדריכים מפורטים.
תכנון גישה אחראית
תוכלו לזהות באופן יזום את הסיכונים הפוטנציאליים של האפליקציה ולהגדיר גישה ברמת המערכת, כדי לפתח אפליקציות בטוחות ואחראיות למשתמשים.
שנתחיל?
הגדרת כללי מדיניות ברמת המערכת
לקבוע איזה סוג של תוכן האפליקציה צריכה ליצור ואיזה לא.
תכנון בטוח
להגדיר את הגישה הכוללת להטמעה של שיטות לצמצום סיכונים, תוך התחשבות בשיקולי ביצועים טכניים ועסקיים.
שקיפות
תוכלו להסביר את הגישה שלכם באמצעות פריטי מידע שנוצרו בתהליך הפיתוח (Artifact), כמו כרטיסי מודל.
מערכות AI מאובטחות
שימוש בסיכוני אבטחה ספציפיים ל-AI ובשיטות תיקון שמודגשים ב-Secure AI Framework (SAIF).
יישור המודל
התאימו את המודל למדיניות הבטיחות הספציפית שלכם באמצעות שיטות של הנחיות וכוונון.
שנתחיל?
בחינת ההנחיות למודל
בעזרת הכלי לחיזוי למידה (LIT) אפשר ליצור הנחיות בטוחות ושימושיות באמצעות שיפור איטרטיבי.
כוונון מודלים לשמירה על בטיחות
כדי לשלוט בהתנהגות המודל, מכווננים את המודל כך שיתאים למדיניות הבטיחות והתוכן.
הערכת המודל
תוכלו להעריך את סיכוני המודל בנוגע לבטיחות, הוגנות ודיוק עובדתי בעזרת ההנחיות והכלים שלנו.
שנתחיל?
משווה של LLM
לבצע הערכות זו לצד זו בעזרת כלי להשוואה של LLM כדי להעריך באופן איכותי את ההבדלים בתשובות בין מודלים, הנחיות שונות לאותו מודל או אפילו התאמות שונות של המודל
הנחיות להערכת המודל
בקורס הזה תלמדו על שיטות מומלצות לחלוקת צוותים לגבי שיתוף פעולה, ואיך להעריך את המודל שלכם ביחס לנקודות השוואה אקדמיות, כדי להעריך נזקים בבטיחות, הוגנות ועובדות.
הגנה באמצעות אמצעי הגנה
סינון הקלט והפלט של האפליקציה, והגן על המשתמשים מפני תוצאות לא רצויות.
שנתחיל?
ShieldGemma
סדרת מסווגים של בטיחות תוכן, מבוססת על Gemma 2, זמינה בשלושה גדלים: 2B, 9B ו-27B.
מסווגים גמישים
יצירת מסווגי בטיחות לכללי המדיניות הספציפיים שלכם באמצעות כוונון יעיל בפרמטרים (PET), עם מעט נתוני אימון
שירות ניהול טקסט
זיהוי רשימה של מאפייני בטיחות, כולל קטגוריות שונות שעלולות להזיק ונושאים שעשויים להיחשב כרגישים באמצעות Google Cloud Natural Language API שזמין בחינם מתחת למגבלת שימוש מסוימת.
ממשק API של Perspective
זיהוי תוכן "רעיל" תגובות באמצעות ה-API החינמי הזה של Google Jigsaw, כדי להפחית רעילות באינטרנט ולהבטיח דיאלוג בריא.