שימוש מסחרי אחראי, כך שתוכלו לשפר אותם ולפרוס אותם בפרויקטים ובאפליקציות שלכם.
Gemma היא משפחה של מודלים של בינה מלאכותית (AI) גנרטיבית, שאפשר להשתמש בהם במגוון רחב של משימות יצירת תוכן, כולל מענה לשאלות, סיכום ושיוך. המודלים של Gemma זמינים עם משקלים פתוחים ומאפשריםהגרסה Gemma 3 כוללת את התכונות העיקריות הבאות. אפשר לנסות את התכונה ב-AI Studio:
- קלט של תמונות וטקסט: יכולות מולטימודליות מאפשרות להזין תמונות וטקסט כדי להבין ולנתח נתונים חזותיים. התחלת הפיתוח
- הקשר של 128,000 טוקנים: הקשר קלט גדול פי 16 לניתוח כמות גדולה יותר של נתונים ולפתרון בעיות מורכבות יותר.
- תמיכה בשפות רבות: אפשר לעבוד בשפה שלכם או להרחיב את היכולות של אפליקציית ה-AI בשפות שונות, עם תמיכה ביותר מ-140 שפות. התחלת הפיתוח
- גדלים של מודלים ידידותיים למפתחים: תוכלו לבחור את גודל המודל (1B, 4B, 12B, 27B) ואת רמת הדיוק שמתאימים ביותר למשימה ולמשאבי המחשוב שלכם.
אפשר להוריד מודלים של Gemma 3 מ-Kaggle ומ-Hugging Face. פרטים טכניים נוספים על Gemma 3 זמינים בכרטיס הדגם ובדוח הטכני. גרסאות קודמות של מודלים הליבה של Gemma זמינות גם להורדה. מידע נוסף זמין במאמר דגמי Gemma קודמים.
לנסות את Gemma 3 להורדה ב-Kaggle להורדה ב-Hugging Face
קלט מרובות מצבים של תמונות וטקסט
Gemma 3 יכולה לטפל במשימות מורכבות יותר של ניתוח ויצירה, בזכות היכולת שלה לטפל בנתוני תמונות וטקסט. אפשר להשתמש במודל כדי לפרש נתוני תמונות, לזהות אובייקטים, לחלץ נתוני טקסט ולבצע משימות רבות אחרות של קלט חזותי להפקת טקסט. התחלת הפיתוח
חלון הקשר שיכול להכיל 128 אלף אסימונים
מודלים של Gemma 3 יכולים לטפל בהזנות של הנחיות עד 128,000 טוקנים, חלון הקשר גדול פי 16 ממודלים קודמים של Gemma. מספר האסימונים הגדול מאפשר לכם לעבד כמה כתבות שמכילות כמה דפים, כתבות ארוכות יותר או מאות תמונות בהנחיה אחת.
תמיכה בשפות רבות
עבודה בשפה שלכם עם תמיכה מובנית ביותר מ-140 שפות. Gemma 3 תורגלה לתמוך במספר גדול של שפות בהשוואה לגרסאות קודמות של Gemma, כך שתוכלו לבצע יותר משימות חזותיות וטקסט בשפות שבהן הלקוחות שלכם משתמשים. התחלת הפיתוח
גדלים של פרמטרים וקידוד (quantization)
הדגמים של Gemma 3 זמינים ב-4 גדלים של פרמטרים ב-5 רמות דיוק, החל מרמת הדיוק המלאה של 32 ביט ועד לרמת הדיוק הנמוכה ביותר של 4 ביט. הגדלים והרמות הדיוק השונות מייצגות פשרות שונות באפליקציית ה-AI שלכם. מודלים עם פרמטרים ויותר ביטים (רמת דיוק גבוהה יותר) בדרך כלל מתפקדים טוב יותר, אבל עלות ההפעלה שלהם גבוהה יותר מבחינת מחזורי העיבוד, עלות הזיכרון וצריכת החשמל. למודלים עם מספר פרמטרים וביט נמוך יותר (רמת דיוק נמוכה יותר) יש יכולות פחותות, אבל יכול להיות שהם מספיקים למשימות ה-AI שלכם. בטבלה הבאה מפורטות הדרישות המשוערות של זיכרון GPU או TPU להרצת מסקנות בכל גודל של גרסאות המודל Gemma 3.
פרמטרים | Full 32bit | BF16 (16 ביט) | SFP8 (8 ביט) |
Q4_0 (4 ביט) |
INT4 (4 ביט) |
---|---|---|---|---|---|
Gemma 3 1B (טקסט בלבד) | 4 GB | 1.5 GB | 1.1 GB | 892 MB | 861 MB |
Gemma 3 4B | 16 GB | 6.4 GB | 4.4 GB | 3.4 GB | 3.2 GB |
Gemma 3 12B | 48 GB | 20 GB | 12.2 GB | 8.7 GB | 8.2 GB |
Gemma 3 27B | 108 GB | 46.4 GB | 29.1 GB | 21 GB | 19.9 GB |
טבלה 1. נפח הזיכרון המשוער של GPU או TPU שנדרש כדי לטעון מודלים של Gemma 3, על סמך מספר הפרמטרים ורמת הקידוד (עומק הבייט).
צריכת הזיכרון גדלה בהתאם למספר הטוקנים הכולל שנדרש להנחיה שאתם מריצים. ככל שמספר האסימונים שנדרשים לעיבוד ההנחיה גדול יותר, כך נדרשת יותר זיכרון, בנוסף לזיכרון שנדרש לטעינת המודל.
מודלים קודמים של Gemma
אפשר לעבוד עם דורות קודמים של מודלים של Gemma, שזמינים גם ב-Kaggle וב-Hugging Face. פרטים טכניים נוספים על הדגמים הקודמים של Gemma זמינים בדפי כרטיס הדגם הבאים:
מוכנים להתחיל לבנות? תחילת העבודה עם מודלים של Gemma