ערכת הכלים ל-AI גנרטיבי אחראי
כלים והנחיות לתכנון, לפיתוח ולהערכה של מודלים פתוחים של AI באופן אחראי.
תכנון אפליקציה אחראי
תוכלו להגדיר כללים להתנהגות של המודל, ליצור אפליקציה בטוחה ואמינה ולנהל תקשורת שקופה עם המשתמשים.
התאמה לבטיחות
טכניקות לניפוי באגים בזמן אמת והנחיות לכוונון ותיקון שגיאות (RLHF) כדי להתאים את מודלי ה-AI למדיניות הבטיחות.
הערכת מודל
בעזרת ה-LLM Comparator תוכלו לקבל הנחיות ונתונים לביצוע הערכה מקיפה של מודל מבחינת הבטיחות, ההגינות והעובדות.
אמצעי הגנה
פריסת סיווגים של בטיחות באמצעות פתרונות מוכנים או פיתוח סיווגים משלכם בעזרת מדריכים מפורטים.
תכנון גישה אחראית
תוכלו לזהות באופן יזום את הסיכונים הפוטנציאליים של האפליקציה ולהגדיר גישה ברמת המערכת, כדי לפתח אפליקציות בטוחות ואחראיות למשתמשים.
שנתחיל?
הגדרת כללי מדיניות ברמת המערכת
קובעים איזה סוג תוכן האפליקציה צריכה ליצור ואיזה סוג תוכן אסור ליצור.
תכנון בטוח
מגדירים את הגישה הכוללת להטמעת שיטות להקטנת סיכונים, תוך התחשבות בפשרות טכניות ועסקיות.
שקיפות
תוכלו להסביר את הגישה שלכם באמצעות פריטי מידע שנוצרו בתהליך הפיתוח (Artifact), כמו כרטיסי מודל.
מערכות AI מאובטחות
שימוש בסיכוני אבטחה ספציפיים ל-AI ובשיטות תיקון שמודגשים ב-Secure AI Framework (SAIF).
יישור המודל
התאימו את המודל למדיניות הבטיחות הספציפית שלכם באמצעות שיטות של הנחיות וכוונון.
שנתחיל?
איך לכתוב הנחיות בטוחות וחזקות יותר
נעזרים ביכולות המתקדמות של מודלים גדולים של שפה כדי ליצור תבניות בטוחות יותר להנחיות בעזרת הספרייה 'יישור מודלים'.
התאמת המודלים לשיפור הבטיחות
כדי לשלוט בהתנהגות המודל, מכווננים את המודל כך שיתאים למדיניות הבטיחות והתוכן.
בדיקת ההנחיות של המודל
בעזרת הכלי לחיזוי למידה (LIT) אפשר ליצור הנחיות בטוחות ושימושיות באמצעות שיפור איטרטיבי.
הערכת המודל
תוכלו להעריך את סיכוני המודל בנוגע לבטיחות, הוגנות ודיוק עובדתי בעזרת ההנחיות והכלים שלנו.
שנתחיל?
משווה של LLM
לבצע הערכות זו לצד זו בעזרת כלי להשוואה של LLM כדי להעריך באופן איכותי את ההבדלים בתשובות בין מודלים, הנחיות שונות לאותו מודל או אפילו התאמות שונות של המודל
הנחיות להערכת המודל
בקורס הזה תלמדו על שיטות מומלצות לחלוקת צוותים לגבי שיתוף פעולה, ואיך להעריך את המודל שלכם ביחס לנקודות השוואה אקדמיות, כדי להעריך נזקים בבטיחות, הוגנות ועובדות.
הגנה באמצעות אמצעי הגנה
סינון הקלט והפלט של האפליקציה והגנה על המשתמשים מפני תוצאות לא רצויות.
שנתחיל?
טקסט SynthID
כלי להוספת סימני מים ולזיהוי טקסט שנוצר על ידי המודל שלכם.
ShieldGemma
סדרת מסווגים של בטיחות תוכן, מבוססת על Gemma 2, זמינה בשלושה גדלים: 2B, 9B ו-27B.
מסווגים גמישים
יצירת מסווגי בטיחות לכללי המדיניות הספציפיים שלכם באמצעות כוונון יעיל בפרמטרים (PET), עם מעט נתוני אימון
בדיקות בטיחות של AI
לוודא תאימות של AI למדיניות התוכן שלכם באמצעות ממשקי API ולוחות בקרה מחוברים.
שירות ניהול טקסט
זיהוי רשימה של מאפייני בטיחות, כולל נושאים וקטגוריות שונים שעשויים להיות מזיקים או רגישים, באמצעות Google Cloud Natural Language API שזמין בחינם עד למגבלת שימוש מסוימת.
ממשק API של Perspective
זיהוי תוכן "רעיל" תגובות באמצעות ה-API החינמי הזה של Google Jigsaw, כדי להפחית רעלות באינטרנט ולהבטיח דיאלוג בריא.