Gemma Open Models
משפחה של מודלים פתוחים וקלים לשימוש, שנוצרו על סמך אותם מחקר וטכנולוגיה ששימשו ליצירת המודלים של Gemini
כדאי לנסות את Gemma 2
Gemma 2 עוצבה מחדש כדי לספק ביצועים יוצאי דופן ויעילות שאין שני לה, והיא מבצעת אופטימיזציה להסקת מסקנות במהירות מסחררת בחומרה מגוונת.
5-shot
MMLU
מדד MMLU הוא בדיקה למדידת היקף הידע ויכולת פתרון הבעיות שמודלים גדולים של שפה צוברים במהלך אימון מקדים.
25 תמונות
ARC-C
מדד ARC-c הוא קבוצת משנה ממוקדת יותר של מערך הנתונים ARC-e, שמכילה רק שאלות שהאלגוריתמים הנפוצים (מבוססי אחזור ואירועים נלווים של מילים) לא הצליחו לענות עליהן נכון.
5-shot
GSM8K
במדד GSM8K נבדקת היכולת של מודל שפה לפתור בעיות מתמטיות ברמת בית הספר היסודי, שבדרך כלל דורשות כמה שלבים של חשיבה.
3-5-shot
AGIEval
בעזרת מדד AGIEval אפשר לבדוק את האינטליגנציה הכללית של מודל שפה באמצעות שאלות שמבוססות על בחינות מהעולם האמיתי שנועדו להעריך את היכולות האינטלקטואליות של בני אדם.
3-shot, CoT
BBH
מדד BBH (BIG-Bench Hard) מתמקד במשימות שנחשבות מעבר ליכולות של מודלים קיימים של שפה, ובוחן את המגבלות שלהם בתחומים שונים של הבנה והסקת מסקנות.
3 צילומים, F1
להתכופף
DROP הוא מדד למדידת הבנת הנקרא, שדורש חשיבה דיסקרטית על קטעים.
5-shot
Winogrande
בעזרת מדד Winogrande אפשר לבדוק את היכולת של מודל שפה לפתור משימות לא ברורות של מילוי החסר עם אפשרויות בינאריות, שדורשות חשיבה כללית לפי תחושת בטן.
10 צילומים
HellaSwag
בעזרת מדד HellaSwag אפשר לבדוק את היכולת של מודל שפה להבין וליישם את ההיגיון הבריא, על ידי בחירת הסיום הכי לוגי לסיפור.
4-shot
MATH
המדד MATH מעריך את היכולת של מודל שפה לפתור בעיות מילוליות מתמטיות מורכבות, שדורשות חשיבה, פתרון בעיות בכמה שלבים והבנה של מושגים מתמטיים.
0-shot
ARC-e
בעזרת מדד ARC-e אפשר לבדוק את היכולות המתקדמות של מודל שפה לענות על שאלות באמצעות שאלות אמריקאיות אמיתיות בנושאי מדע ברמת בית הספר היסודי.
0-shot
PIQA
בעזרת מדד PIQA אפשר לבדוק את היכולת של מודל שפה להבין ידע פיזי שכולל תחושה כללית ולהחיל אותו על ידי מענה על שאלות לגבי אינטראקציות פיזיות יומיומיות.
0-shot
SIQA
בעזרת מדד SIQA אפשר להעריך את ההבנה של מודל שפה בנוגע לאינטראקציות חברתיות ולשכל הישר החברתי. לשם כך, מוצגות שאלות לגבי הפעולות של אנשים וההשלכות החברתיות שלהן.
0-shot
Boolq
בעזרת אמת המידה BoolQ אפשר לבדוק את היכולת של מודל שפה לענות על שאלות מסוג כן/לא שמתרחשות באופן טבעי, ובכך לבדוק את היכולת של המודלים לבצע משימות של הסקת מסקנות משפה טבעית בעולם האמיתי.
5-shot
TriviaQA
במדד הביצועים של TriviaQA נבדקות מיומנויות הבנת הנקרא באמצעות טריופל של שאלה-תשובה-הוכחה.
5-shot
NQ
בדיקת העמידה בתקן NQ (שאלות טבעיות) בודקת את היכולת של מודל שפה למצוא תשובות בתוך מאמרים שלמים בוויקיפדיה ולהבין אותן, תוך סימולציה של תרחישים של מתן תשובות לשאלות בעולם האמיתי.
pass@1
HumanEval
בעזרת מדד HumanEval אפשר לבדוק את היכולות של מודל שפה ליצירת קוד. לשם כך, המערכת בודקת אם הפתרונות שלו עוברים בדיקות יחידה פונקציונליות לבעיות תכנות.
3 שוטים
MBPP
במדד MBPP נבדקת היכולת של מודל שפה לפתור בעיות תכנות בסיסיות ב-Python, תוך התמקדות במושגי תכנות בסיסיים ובשימוש בספריות סטנדרטיות.
100%
75%
50%
25%
0%
100%
75%
50%
25%
0%
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
27B
*אלה נקודות השוואה למודלים שהוכשרו מראש. בדוח הטכני מפורט מידע על הביצועים בשיטות אחרות.
מודלים למחקר
היכרות עם משפחת הדגמים המורחבת של Gemma
Gemmaverse – עולם חדש של תכנים
סביבה רחבה של מודלים וכלים של Gemma שנוצרו על ידי הקהילה, שיעזרו לכם לחדש ולהתחדש
פיתוח פתרונות
תחילת העבודה עם Gemma
פריסת מודלים
בחירת יעד הפריסה
נייד
פריסה במכשיר באמצעות Google AI Edge
פריסת הפונקציות ישירות במכשירים כדי ליהנות מזמן אחזור קצר ופונקציונליות אופליין. מתאים במיוחד לאפליקציות שדורשות תגובה מיידית ופרטיות, כמו אפליקציות לנייד, מכשירי IoT ומערכות מוטמעות.
אינטרנט
שילוב חלק באפליקציות אינטרנט
שדרוג האתרים ושירותי האינטרנט שלכם באמצעות יכולות AI מתקדמות, שמאפשרות תכונות אינטראקטיביות, תוכן מותאם אישית ואוטומציה חכמה.
Cloud
התאמה לעומס בקלות באמצעות תשתית ענן
נצלו את הגמישות וההתאמה לעומס של הענן כדי לטפל בפריסות בקנה מידה רחב, בעומסי עבודה כבדים ובאפליקציות AI מורכבות.
ביטול הנעילה של התקשורת הגלובלית
הצטרפו לתחרות הגלובלית שלנו ב-Kaggle. יצירת וריאנטים של מודלים של Gemma לשפה ספציפית או לאספקט תרבותי ייחודי