תחילת העבודה עם מודלים של Gemma

משפחת המודלים הפתוחים של Gemma כוללת מגוון גדלים של מודלים, יכולות ווריאציות שמתמחות במשימות, כדי לעזור לכם לבנות פתרונות גנרטיביים בהתאמה אישית. אלה הדרכים העיקריות שבהן אפשר להשתמש במודלים של Gemma באפליקציה:

  • בוחרים מודל ופורסים אותו כמו שהוא באפליקציה
  • בוחרים מודל, מכווננים אותו למשימה ספציפית ואז פורסים אותו באפליקציה או משתפים אותו עם הקהילה.

המדריך הזה יעזור לכם לבחור מודל, לבדוק את היכולות שלו, ואם תרצו, לכוונן את המודל שבחרתם כדי שיתאים לאפליקציה שלכם.

להורדה מ-Kaggle להורדה מ-Hugging Face

בחירת מודל

בקטע הזה נסביר על הגרסאות הרשמיות של משפחת מודלים Gemma ואיך לבחור מודל לאפליקציה שלכם. הווריאציות של המודלים מספקות יכולות כלליות או מתמחות במשימות ספציפיות, והן זמינות בגדלים שונים של פרמטרים, כך שתוכלו לבחור מודל עם היכולות המועדפות עליכם שעומד בדרישות החישוב שלכם.

בטבלה הבאה מפורטים הווריאציות העיקריות של משפחת מודלים Gemma ופלטפורמות הפריסה המיועדות שלהן:

Gemma 4 Family

הדור האחרון עם קלט מולטי-מודאלי (טקסט, תמונה, אודיו).

גודל וריאנט קלט ➔ פלט פלטפורמה מיועדת
E2B Gemma 4 (core) טקסט, תמונות, אודיו ➔ טקסט מכשירים ניידים
E4B Gemma 4 (core) טקסט, תמונות, אודיו ➔ טקסט מכשירים ניידים ומחשבים ניידים
A4B Gemma 4 (core) טקסט, תמונות ➔ טקסט מחשבים שולחניים ושרתים קטנים
31B Gemma 4 (core) טקסט, תמונות ➔ טקסט שרתים גדולים או אשכולות שרתים

משפחת Gemma 3 ו-3n

מודלי ליבה לעיבוד טקסט ותמונות שניתן להרחבה, בנוסף לווריאציות '3n' לקלט מולטי-מודאלי מורחב.

גודל וריאנט קלט ➔ פלט פלטפורמה מיועדת
270 מיליון Gemma 3 (core) טקסט ➔ טקסט מכשירים ניידים ומחשבים לוח-יחיד
1B Gemma 3 (core) טקסט ➔ טקסט מכשירים ניידים ומחשבים לוח-יחיד
E2B Gemma 3n טקסט, תמונות, אודיו ➔ טקסט מכשירים ניידים
4B Gemma 3 (core) טקסט, תמונות ➔ טקסט מחשבים שולחניים ושרתים קטנים
E4B Gemma 3n טקסט, תמונות, אודיו ➔ טקסט מכשירים ניידים ומחשבים ניידים
12B Gemma 3 (core) טקסט, תמונות ➔ טקסט מחשבים שולחניים ושרתים מתקדמים יותר
27B Gemma 3 (core) טקסט, תמונות ➔ טקסט שרתים גדולים או אשכולות שרתים

Gemma 2 Family

כולל מודלים סטנדרטיים של טקסט וגרסאות שונות של PaliGemma 2 מולטי-מודאלי לראייה ושפה.

גודל וריאנט קלט ➔ פלט פלטפורמה מיועדת
2B Gemma 2 (core) טקסט ➔ טקסט מכשירים ניידים ומחשבים ניידים
3B PaliGemma 2 טקסט, תמונות ➔ טקסט מחשבים שולחניים ושרתים קטנים
9B Gemma 2 (core) טקסט ➔ טקסט מחשבים שולחניים ושרתים מתקדמים יותר
10B PaliGemma 2 טקסט, תמונות ➔ טקסט מחשבים שולחניים ושרתים מתקדמים יותר
27B Gemma 2 (core) טקסט ➔ טקסט שרתים גדולים או אשכולות שרתים
28B PaliGemma 2 טקסט, תמונות ➔ טקסט שרתים גדולים או אשכולות שרתים

Gemma 1 Family

הדור המקורי, כולל וריאציות ספציפיות לקידוד.

גודל וריאנט קלט ➔ פלט פלטפורמה מיועדת
2B Gemma (ליבה)
CodeGemma
טקסט ➔ טקסט מכשירים ניידים ומחשבים ניידים
7B Gemma (ליבה)
CodeGemma
טקסט ➔ טקסט מחשבים שולחניים ושרתים קטנים

משפחת המודלים של Gemma כוללת גם מודלים למטרות מיוחדות ומודלים למחקר, כולל ShieldGemma,‏ DataGemma,‏ Gemma Scope ו-Gemma-APS.

מודלים לבדיקה

כדי לבדוק מודלים של Gemma, צריך להגדיר סביבת פיתוח עם מודל שהורד ותוכנה תומכת. אחר כך תוכלו לתת הנחיות למודל ולהעריך את התשובות שלו. כדי להגדיר סביבת בדיקה ולהנחות מודל Gemma, אפשר להשתמש באחד ממחברות Python הבאות עם מסגרת הלמידה המועדפת שלכם:

התאמת מודלים

אפשר לשנות את ההתנהגות של מודלים של Gemma באמצעות כוונון שלהם. כדי לשפר מודל צריך מערך נתונים של תשומות ותשובות צפויות בגודל מספיק ובמגוון מספיק כדי להנחות את התנהגות המודל. בנוסף, כדי להשלים תהליך כוונון צריך הרבה יותר משאבי מחשוב וזיכרון בהשוואה להרצת מודל Gemma ליצירת טקסט. כדי להגדיר סביבת פיתוח לשיפור מודל Gemma ולשפר אותו, אפשר להשתמש באחד ממחברות Python הבאות:

השלבים הבאים

במדריכים הבאים אפשר למצוא מידע נוסף על בניית פתרונות באמצעות Gemma: