עיצוב Gemma והוראות מערכת

בדף הזה
הוראות למערכת

מודלים של Gemma עם התאמה להוראות (IT) עוברים אימון באמצעות פורמטור ספציפי שמוסיף הערות עם מידע נוסף לכל הדוגמאות להתאמה להוראות, גם במהלך האימון וגם במהלך ההסקה. למעצב יש שני שימושים:

סימון תפקידים בשיחה, כמו התפקידים מערכת, משתמש או עוזר.
להבדיל בין תורות בשיחה, במיוחד בשיחה עם כמה תורות.

בהמשך מפורטים אסימוני הבקרה שבהם Gemma משתמשת ותרחישי השימוש שלהם. חשוב לזכור שטוקני הבקרה שמורים במפַתח המחרוזות שלנו וספציפיים לו.

אסימון לציון תורו של משתמש: user
אסימון לציון פנייה במודל: model
אסימון לציון תחילת תורו של הדובר: <start_of_turn>
אסימון לציון סוף תורו של הדובר: <end_of_turn>

הנה דוגמה לדיאלוג:

<start_of_turn>user
knock knock<end_of_turn>
<start_of_turn>model
who is there<end_of_turn>
<start_of_turn>user
Gemma<end_of_turn>
<start_of_turn>model
Gemma who?<end_of_turn>

האסימון "<end_of_turn>\n" הוא מפריד התור והתחילית של ההנחיה היא "<start_of_turn>model\n". כלומר, אם רוצים להציג מודל עם שאלה כמו "מהו כלל Cramer?", צריך להזין את המודל באופן הבא:

"<start_of_turn>user
What is Cramer's Rule?<end_of_turn>
<start_of_turn>model"

הערה: אם אתם רוצים לשפר את מודל Gemma המאומן מראש באמצעות הנתונים שלכם, תוכלו להשתמש בכל סכימת אסימונים כזו לבקרה, כל עוד היא עקבית בין תרחישי האימון וההסקה.

הוראות למערכת

המודלים של Gemma שמותאמים להוראות מיועדים לעבוד עם שני תפקידים בלבד: user ו-model. לכן אין תמיכה בתפקיד system או בפנייה של מערכת.

במקום להשתמש בתפקיד מערכת נפרד, אפשר לספק הוראות ברמת המערכת ישירות בהנחיה הראשונית למשתמש. היכולות של ההוראות במודל מאפשרות ל-Gemma לפרש את ההוראות בצורה יעילה. לדוגמה:

<start_of_turn>user
Only reply like a pirate.

What is the answer to life the universe and everything?<end_of_turn>
<start_of_turn>model
Arrr, 'tis 42,<end_of_turn>