Gemma 3n – הגרסה החדשה כוללת קלט אודיו ועברה אופטימיזציה לשימוש במכשירים יומיומיים. מידע נוסף

כוונון עדין של מודל Gemma

כוונון עדין של מודל בינה מלאכותית (AI) גנרטיבי, כמו Gemma, משנה את ההתנהגות של המודל. בדרך כלל, מכווננים את Gemma במטרה לשפר את הביצועים שלה במשימה או בדומיין ספציפיים, או כדי למלא תפקיד טוב יותר, כמו שירות לקוחות. מודלים של Gemma מופצים עם משקלים פתוחים, כלומר אפשר לשנות את המשקלים האלה, וכך לשנות את ההתנהגות של המודל. אלה השלבים הכלליים לביצוע התאמה עדינה של מודל Gemma:

בחירת מסגרת
איסוף נתונים
כוונון ובדיקה של המודל
פריסת המודל

בחירת מסגרת

מודלים של Gemma תואמים למגוון מסגרות לכוונון AI. לכל מסגרת יש יתרונות שונים, והיא בדרך כלל מוגבלת לפורמט מודל ספציפי. הנה מדריכים לכוונון מודלים של Gemma באמצעות מסגרות שונות:

‫Keras באמצעות LoRA
ספריית Gemma ל-JAX
‫Hugging Face
‫Google Cloud GKE (multi-GPU with HF Transformers)
Google Cloud Vertex AI
Unsloth
Axolotl
‫Keras באמצעות כוונון מבוזר

מוודאים שהפורמט של מודל הפריסה המיועד, כמו פורמט Keras,‏ Safetensors או GGUF, נתמך כפלט על ידי המסגרת שבחרתם.

איסוף נתונים

כדי לכוונן מודל צריך נתונים. נתוני התאמה בדרך כלל מורכבים מזוגות של נתוני קלט עם התגובה הצפויה. יש הרבה מערכי נתונים ציבוריים באינטרנט שאפשר להשתמש בהם לאימון של משימות שונות או פלט שונה. לדוגמה, אם רוצים לאמן מודל Gemma לתרגום תיאורים של חלקי רכב למספרי חלקים, יכול להיות שערכת הנתונים תכלול את הדברים הבאים:

training_data = [
  {"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
  {"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
  {"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]

אם רוצים שמודל Gemma יבצע קבוצה ספציפית של משימות או תפקיד מסוים, בדרך כלל צריך לקבץ מערך נתונים שמדגים כמה וריאציות של אותה משימה. כמות הנתונים שצריך כדי לכוונן מודל תלויה ביעדים שלכם, ובמיוחד במידת השינוי ההתנהגותי שאתם רוצים שהמודל יבצע, וברמת הביצועים שאתם רוצים שהמודל ישיג על סמך המשימה שצריך לבצע ורמת השונות בנתוני הקלט.

באופן כללי, כדאי להתחיל עם מערך קטן של נתונים לצורך כוונון המשימה, לשנות את פרמטרים האימון ולהוסיף נתונים עד שמגיעים לביצועים של המשימה שעונים על הצרכים שלכם. חלק מהאפליקציות לדוגמה שלנו מראות שאפשר להשפיע על ההתנהגות של מודל Gemma באמצעות 20 זוגות בלבד של הנחיות ותשובות. פרטים נוספים זמינים במאמרים יצירת עוזר AI לאימייל עסקי באמצעות Gemma וביצוע משימות בשפות מדוברות באמצעות Gemma.

כוונון ובדיקה של המודל

אחרי שמגדירים מסגרת לכוונון ונתוני כוונון, אפשר להתחיל בתהליך הכוונון של מודל Gemma. כשמבצעים אופטימיזציה, יש כמה אפשרויות לאופטימיזציה שמשפיעות על המשאבים שנדרשים להשלמת התהליך. כדאי גם ליצור תוכנית בדיקה למודל המכוונן כדי להעריך אם הוא פועל כמו שרוצים אחרי הכוונון.

כוונון יעיל בפרמטרים

כשמבצעים כוונון עדין של מודל עם משקלים פתוחים כמו Gemma, יש אפשרות לכוונן את כל הפרמטרים של המודל או להשתמש בטכניקת כוונון יעילה שדורשת פחות משאבים ומעדכנת קבוצת משנה של הפרמטרים. גישת כוונון מלא פירושה שכשמחילים את נתוני הכוונון, מחשבים משקלים חדשים לכל הפרמטרים של המודל. הגישה הזו דורשת הרבה משאבי מחשוב וזיכרון, כי אתם מבצעים את החישובים האלה למיליארדי פרמטרים. שימוש בגישות כוונון שדורשות פחות משאבים, שנקראות כוונון יעיל בפרמטרים (PEFT), כולל טכניקות כמו כוונון Low Rank Adapter (LoRA), יכול להניב תוצאות דומות עם פחות משאבי מחשוב. פרטים על ביצוע אופטימיזציה עם פחות משאבים באמצעות LoRA זמינים במאמרים Fine-tune Gemma models in Keras using LoRA (אופטימיזציה של מודלים של Gemma ב-Keras באמצעות LoRA) ו-Fine-Tuning Gemma Models in Hugging Face (אופטימיזציה של מודלים של Gemma ב-Hugging Face).

בדיקה של מודלים שעברו התאמה

אחרי שמכווננים מודל למשימה ספציפית, צריך לבדוק את הביצועים שלו ביחס למערכת המשימות שרוצים שהוא יבצע. כדאי לבדוק את המודל באמצעות משימות או בקשות שהוא לא אומן עליהן באופן ספציפי. אופן הבדיקה של המודל המותאם תלוי במשימה שרוצים שהוא יבצע ובמידת הניהול של נתוני הקלט והפלט של המודל. דרך נפוצה לנהל בדיקות של מודלים גנרטיביים היא להשתמש במקרים של הצלחה, כישלון ומקרים גבוליים:

בדיקות הצלחה: בקשות שהמודל המכוונן צריך תמיד להיות מסוגל לבצע בהצלחה.
בדיקות כשל: בקשות שהמודל המכוונן לא אמור להיות מסוגל לבצע, או אמור לסרב לבצע באופן מפורש, אם מתבקש.
בדיקות גבולות: בקשות שהמודל המכוונן צריך להיות מסוגל לבצע, אם הן נמצאות בתוך גבול מוגדר או קבוצה של גבולות של התנהגות פלט מקובלת.

כשבודקים תנאי כשל או תנאי קצה באפליקציה מבוססת-AI גנרטיבי, צריך גם להשתמש בגישות, בטכניקות ובכלים לאבטחת AI גנרטיבי שמתוארים בערכת הכלים לשימוש אחראי ב-AI גנרטיבי.

פריסת המודל

אחרי שתסיימו את ההתאמה ואת הבדיקות, הגיע הזמן לפרוס את המודל. בדרך כלל אפשר לעיין בתיעוד של המסגרת שבחרתם כדי ללמוד איך לפרוס מודל שעבר התאמה.

אם אתם פורסים מודל עם משקלים מכווננים של LoRA, שימו לב שבטכניקה הזו אתם בדרך כלל פורסים גם את המודל המקורי ואת המשקלים שלו עם משקלי LoRA כשכבת חישוב נוספת למודל.