Gemma היא משפחה של מודלים של בינה מלאכותית (AI) גנרטיבית, שאפשר להשתמש בהם במגוון רחב של משימות יצירת תוכן, כולל מענה לשאלות, סיכום ושיוך. המודלים של Gemma זמינים עם משקלים פתוחים ומאפשרים שימוש מסחרי אחראי, כך שתוכלו לשפר אותם ולפרוס אותם בפרויקטים ובאפליקציות שלכם.
הגרסה Gemma 3 כוללת את התכונות העיקריות הבאות. אפשר לנסות את התכונה ב-AI Studio:
- קלט של תמונות וטקסט: היכולות המולטי-מודאליות מאפשרות להזין תמונות וטקסט כדי להבין ולנתח נתונים חזותיים. התחלת הבנייה
- הקשר של 128,000 טוקנים: הקשר קלט גדול פי 16 לניתוח כמות גדולה יותר של נתונים ולפתרון בעיות מורכבות יותר.
- קריאה לפונקציות: פיתוח ממשקים בשפה טבעית לעבודה עם ממשקי תכנות. התחלת הבנייה
- תמיכה בשפות רבות: אפשר לעבוד בשפה שלכם או להרחיב את היכולות של אפליקציית ה-AI בשפות שונות, עם תמיכה ביותר מ-140 שפות. התחלת הבנייה
- גדלים של מודלים ידידותיים למפתחים: תוכלו לבחור את גודל המודל (1B, 4B, 12B, 27B) ואת רמת הדיוק שמתאימים ביותר למשימה ולמשאבי המחשוב שלכם.
אפשר להוריד מודלים של Gemma 3 מ-Kaggle ומ-Hugging Face. פרטים טכניים נוספים על Gemma 3 זמינים בכרטיס הדגם ובדוח הטכני. גרסאות קודמות של מודלים הליבה של Gemma זמינות גם להורדה. מידע נוסף זמין במאמר דגמי Gemma קודמים.
לנסות את Gemma 3 להורדה ב-Kaggle להורדה ב-Hugging Face
קלט מרובות מצבים של תמונות וטקסט
Gemma 3 יכולה לטפל במשימות מורכבות יותר של ניתוח ויצירה, בזכות היכולת שלה לטפל בנתוני תמונות וטקסט. אפשר להשתמש במודל כדי לפרש נתוני תמונות, לזהות אובייקטים, לחלץ נתוני טקסט ולבצע משימות רבות אחרות של קלט חזותי להפקת טקסט. התחלת הבנייה
חלון הקשר שיכול להכיל 128 אלף אסימונים
מודלים של Gemma 3 יכולים לטפל בהזנות של הנחיות עד 128,000 טוקנים, חלון הקשר גדול פי 16 ממודלים קודמים של Gemma. מספר האסימונים הגדול מאפשר לכם לעבד כמה כתבות שמכילות כמה דפים, כתבות ארוכות יותר או מאות תמונות בהנחיה אחת.
תמיכה בשפות רבות
עבודה בשפה שלכם עם תמיכה מובנית ביותר מ-140 שפות. Gemma 3 תורגלה לתמוך במספר גדול של שפות בהשוואה לגרסאות קודמות של Gemma, כך שתוכלו לבצע יותר משימות חזותיות וטקסט בשפות שבהן הלקוחות שלכם משתמשים. התחלת הפיתוח
קריאה לפונקציה
פיתוח אמצעי בקרה חכמים בשפה טבעית לממשקי תכנות. ב-Gemma 3 אפשר להגדיר פונקציות תכנות עם תחביר ומגבלות ספציפיים, והמודל יכול להפעיל את הפונקציות האלה כדי להשלים משימות. התחלת הפיתוח
גדלים של פרמטרים וקידוד (quantization)
הדגמים של Gemma 3 זמינים ב-4 גדלים של פרמטרים ב-5 רמות דיוק, החל מרמת הדיוק המלאה של 32 ביט ועד לרמת הדיוק הנמוכה ביותר של 4 ביט. הגדלים והרמות הדיוק השונות מייצגות פשרות שונות באפליקציית ה-AI שלכם. בדרך כלל, מודלים עם פרמטרים ומספר ביט גבוהים יותר (רמת דיוק גבוהה יותר) הם יעילים יותר, אבל עלות ההפעלה שלהם גבוהה יותר מבחינת מחזורי עיבוד, עלות זיכרון וצריכת חשמל. למודלים עם מספר פרמטרים וביט נמוך יותר (רמת דיוק נמוכה יותר) יש יכולות פחותות, אבל יכול להיות שהם מספיקים למשימות ה-AI שלכם. בטבלה הבאה מפורטות הדרישות המשוערות של זיכרון GPU או TPU להרצת מסקנות בכל גודל של גרסאות המודל Gemma 3.
פרמטרים | Full 32bit | BF16 (16 ביט) | SFP8 (8 ביט) |
Q4_0 (4 ביט) |
INT4 (4 ביט) |
---|---|---|---|---|---|
Gemma 3 1B (טקסט בלבד) | 4 GB | 1.5 GB | 1.1 GB | 892 MB | 861 MB |
Gemma 3 4B | 16 GB | 6.4 GB | 4.4 GB | 3.4 GB | 3.2 GB |
Gemma 3 12B | 48 GB | 20 GB | 12.2 GB | 8.7 GB | 8.2 GB |
Gemma 3 27B | 108 GB | 46.4 GB | 29.1 GB | 21 GB | 19.9 GB |
טבלה 1. נפח הזיכרון המשוער של GPU או TPU שנדרש כדי לטעון מודלים של Gemma 3, על סמך מספר הפרמטרים ורמת הקידוד (עומק הבייט).
צריכת הזיכרון גדלה בהתאם למספר הטוקנים הכולל שנדרש להנחיה שאתם מריצים. ככל שמספר האסימונים שנדרשים לעיבוד ההנחיה גדול יותר, כך נדרשת יותר זיכרון, בנוסף לזיכרון שנדרש לטעינת המודל.
דגמי Gemma קודמים
אפשר לעבוד עם דורות קודמים של מודלים של Gemma, שזמינים גם ב-Kaggle וב-Hugging Face. פרטים טכניים נוספים על דגמי Gemma קודמים זמינים בדפי כרטיס הדגם הבאים:
מוכנים להתחיל לבנות? איך מתחילים להשתמש במודלים של Gemma?