סקירה כללית של דגם Gemma 3

Gemma היא משפחה של מודלים של בינה מלאכותית (AI) גנרטיבית, שאפשר להשתמש בהם במגוון רחב של משימות יצירת תוכן, כולל מענה לשאלות, סיכום ושיוך. המודלים של Gemma זמינים עם משקלים פתוחים ומאפשרים שימוש מסחרי אחראי, כך שתוכלו לשפר אותם ולפרוס אותם בפרויקטים ובאפליקציות שלכם.

הגרסה Gemma 3 כוללת את התכונות העיקריות הבאות. אפשר לנסות את התכונה ב-AI Studio:

אפשר להוריד מודלים של Gemma 3 מ-Kaggle ומ-Hugging Face. פרטים טכניים נוספים על Gemma 3 זמינים בכרטיס הדגם ובדוח הטכני. גרסאות קודמות של מודלים הליבה של Gemma זמינות גם להורדה. מידע נוסף זמין במאמר דגמי Gemma קודמים.

לנסות את Gemma 3 להורדה ב-Kaggle להורדה ב-Hugging Face

קלט מרובות מצבים של תמונות וטקסט

Gemma 3 יכולה לטפל במשימות מורכבות יותר של ניתוח ויצירה, בזכות היכולת שלה לטפל בנתוני תמונות וטקסט. אפשר להשתמש במודל כדי לפרש נתוני תמונות, לזהות אובייקטים, לחלץ נתוני טקסט ולבצע משימות רבות אחרות של קלט חזותי להפקת טקסט. התחלת הפיתוח

חלון הקשר שיכול להכיל 128 אלף אסימונים

מודלים של Gemma 3 יכולים לטפל בהזנות של הנחיות עד 128,000 טוקנים, חלון הקשר גדול פי 16 ממודלים קודמים של Gemma. מספר האסימונים הגדול מאפשר לכם לעבד כמה כתבות שמכילות כמה דפים, כתבות ארוכות יותר או מאות תמונות בהנחיה אחת.

תמיכה בשפות רבות

עבודה בשפה שלכם עם תמיכה מובנית ביותר מ-140 שפות. Gemma 3 תורגלה לתמוך במספר גדול של שפות בהשוואה לגרסאות קודמות של Gemma, כך שתוכלו לבצע יותר משימות חזותיות וטקסט בשפות שבהן הלקוחות שלכם משתמשים. התחלת הפיתוח

גדלים של פרמטרים וקידוד (quantization)

הדגמים של Gemma 3 זמינים ב-4 גדלים של פרמטרים ב-5 רמות דיוק, החל מרמת הדיוק המלאה של 32 ביט ועד לרמת הדיוק הנמוכה ביותר של 4 ביט. הגדלים והרמות הדיוק השונות מייצגות פשרות שונות באפליקציית ה-AI שלכם. מודלים עם פרמטרים ויותר ביטים (רמת דיוק גבוהה יותר) בדרך כלל מתפקדים טוב יותר, אבל עלות ההפעלה שלהם גבוהה יותר מבחינת מחזורי העיבוד, עלות הזיכרון וצריכת החשמל. למודלים עם מספר פרמטרים וביט נמוך יותר (רמת דיוק נמוכה יותר) יש יכולות פחותות, אבל יכול להיות שהם מספיקים למשימות ה-AI שלכם. בטבלה הבאה מפורטות הדרישות המשוערות של זיכרון GPU או TPU להרצת מסקנות בכל גודל של גרסאות המודל Gemma 3.

פרמטרים Full 32bit BF16 (16 ביט) SFP8
(8 ביט)
Q4_0
(4 ביט)
INT4
(4 ביט)
Gemma 3 1B‏ (טקסט בלבד) 4‎ GB 1.5 GB 1.1 GB 892 MB 861 MB
Gemma 3 4B 16 GB 6.4 GB 4.4 GB 3.4 GB 3.2 GB
Gemma 3 12B 48 GB ‎20 GB 12.2 GB 8.7 GB 8.2 GB
Gemma 3 27B 108 GB 46.4 GB 29.1 GB 21 GB 19.9 GB

טבלה 1. נפח הזיכרון המשוער של GPU או TPU שנדרש כדי לטעון מודלים של Gemma 3, על סמך מספר הפרמטרים ורמת הקידוד (עומק הבייט).

צריכת הזיכרון גדלה בהתאם למספר הטוקנים הכולל שנדרש להנחיה שאתם מריצים. ככל שמספר האסימונים שנדרשים לעיבוד ההנחיה גדול יותר, כך נדרשת יותר זיכרון, בנוסף לזיכרון שנדרש לטעינת המודל.

מודלים קודמים של Gemma

אפשר לעבוד עם דורות קודמים של מודלים של Gemma, שזמינים גם ב-Kaggle וב-Hugging Face. פרטים טכניים נוספים על הדגמים הקודמים של Gemma זמינים בדפי כרטיס הדגם הבאים:

מוכנים להתחיל לבנות? תחילת העבודה עם מודלים של Gemma