מודלים פתוחים של Gemma
משפחה של מודלים חד-פעמיים קלילים ואומנותיים שפותחה מאותם מחקר וטכנולוגיה ששימשו ליצירת המודלים של Gemini.
חדש:
Gemma 2
Gemma 2, שתוכננה מחדש כדי לאפשר ביצועים גדולים ויעילות חסרת תקדים, מבצעת אופטימיזציה להסקת מסקנות מהירה במיוחד בעזרת מגוון חומרה.
5 שוטים
MMLU
נקודת ההשוואה של MMLU היא בדיקה שמודדת את היקף הידע ויכולת פתרון הבעיות שנרכשו על ידי מודלים גדולים של שפה במהלך אימון מראש.
25 שוטים
ARC-C
נקודת ההשוואה ARC-c היא קבוצת משנה ממוקדת יותר של מערך הנתונים ARC-e, שמכילה רק שאלות שנענו באופן שגוי על ידי אלגוריתמים נפוצים (בסיס אחזור ומופע מילים).
5 שוטים
GSM8K
נקודת ההשוואה GSM8K בודקת את היכולת של מודל שפה לפתור בעיות מתמטיות ברמת בית הספר של הכיתה, שמצריכות לעיתים קרובות שלבים רבים.
3-5 שוטים
AGIEval
נקודת ההשוואה של AGIEval בודקת את הבינה הכללית של מודל שפה באמצעות שאלות שנגזרות מבחינות בעולם האמיתי, שנועדו להעריך יכולות אינטלקטואליות של בני אדם.
3 שוטים, קוטל
BBH
נקודת ההשוואה BBH (BIG-Bench Hard) מתמקדת במשימות מעבר ליכולת של מודלי השפה הנוכחיים, ובודקת את הגבולות שלהן במגוון תחומים של הסקת מסקנות והבנה.
3 תמונות, F1
להתכופף
DROP הוא נקודת השוואה להבנת הנקרא שדורשת נימוק לא רציף על פני פסקאות.
5 שוטים
וינוגראנדה
נקודת ההשוואה ב-Winogrande בודקת את היכולת של מודל שפה לפתור משימות מעורפלות של מילוי ריק באמצעות אופציות בינאריות, שדורשות הסקת מסקנות כללית.
10 שוטים
HellaSwag
בנצ'מרק HellaSwag בודק את היכולת של מודל שפה להבין ולהפעיל חשיבה ישרה על ידי בחירת הסיום ההגיוני ביותר לסיפור.
4 שוטים
מתמטיקה
MATH מעריך את היכולת של מודל שפה לפתור בעיות מילוליות מורכבות מתמטיות, המחייבות הסקת מסקנות, פתרון בעיות מרובה שלבים והבנה של מושגים מתמטיים.
אפס בעיטות
ARC-e
בנצ'מרק ARC-e נבדקת מיומנויות מענה לשאלות מתקדמות של מודל שפה, ברמת כיתה אמיתית, שאלות מדעיות אמריקאיות.
אפס בעיטות
PIQA
נקודת ההשוואה של PIQA בודקת את היכולת של מודל שפה להבין וליישם ידע פיזיקלי באמצעות מענה על שאלות לגבי אינטראקציות פיזיות יומיומיות.
אפס בעיטות
SIQA
נקודת ההשוואה של SIQA בודקת את ההבנה של מודל שפה לגבי אינטראקציות חברתיות והיגיון חברתי, באמצעות שאילת שאלות לגבי פעולות של אנשים וההשלכות החברתיות שלהם.
אפס בעיטות
Boolq
נקודת ההשוואה ב-BolQ בודקת את היכולת של מודל שפה לענות על שאלות "כן" ו"לא" באופן טבעי, ובודקת את היכולת של המודלים לבצע משימות של הסקת מסקנות משפה טבעית בעולם האמיתי.
5 שוטים
TriviaQA
בנצ'מרק של TriviaQA ניתן לבדוק את כישורי הבנת הקריאה עם שלשות עדות לשאלה.
5 שוטים
NQ
נקודת ההשוואה ב-NQ (שאלות טבעיות) בודקת את היכולת של מודל שפה למצוא ולהבין תשובות בתוך מאמרים שלמים בוויקיפדיה, באמצעות הדמיית תרחישים של מענה לשאלות בעולם האמיתי.
Pass@1
HumanEval
נקודת ההשוואה של HumanEval בודקת את יכולות יצירת הקוד של מודל שפה מסוים על ידי הערכה אם הפתרונות שלו עוברים בדיקות יחידה פונקציונלית לבעיות תכנות.
שלשות
MBPP
בנצ'מרק של MBPP בודק את היכולת של מודל שפה לפתור בעיות בסיסיות בתכנות Python, תוך התמקדות במושגי תכנות בסיסיים ובשימוש סטנדרטי בספרייה.
100%
75%
50%
25%
0%
100%
75%
50%
25%
0%
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
לאמה 3
8ב
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
לאמה 3
8ב
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
לאמה 3
8ב
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
לאמה 3
8ב
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
לאמה 3
8ב
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
לאמה 3
8ב
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
לאמה 3
8ב
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
לאמה 3
8ב
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
Gemma 1
2.5 מיליארד
Gemma 2
2.6 מיליארד
Mistral
7 מיליארד
Gemma 1
7 מיליארד
Gemma 2
9 מיליארד
Gemma 2
27 מיליארד
*אלה נקודות ההשוואה של המודלים שעברו אימון מראש. בדוח הטכני אפשר למצוא פרטים על הביצועים עם שיטות אחרות.
משפחת המודלים של Gemma
כדאי להכיר את הכלים שלנו
מדריכים למתחילים למפתחים
מדריכים למתחילים לשותפים
המתכונים שלי ל-Gemma
אוסף של מתכונים מעשיים ודוגמאות שמציגים את הכוח והמגוון של השימוש ב-Gemma למשימות כמו הוספת כיתוב לתמונה באמצעות PaliGemma, יצירת קוד באמצעות CodeGemma ובניית צ'אט בוטים עם מודלים עדינים של Gemma.
פיתוח אחראי של בינה מלאכותית
אחריות במרכז
שעברו אימון על סמך נתונים שנאספו בקפידה והקפדה על אמצעי הבטיחות לשמירה על הבטיחות. כך ניתן לקדם פיתוח בטוח ואחראי של AI, שמבוססים על מודלים של Gemma.
בדיקה קפדנית ושקופה
הערכות מקיפות ודיווח שקוף חושפים את המגבלות על המודל, כדי לאמץ גישה אחראית לכל תרחיש לדוגמה.
פיתוח אחראי
ערכת הכלים האחריות של בינה מלאכותית גנרטיבית תומכת במפתחים לפתח ולהטמיע שיטות מומלצות לשמירה על בינה מלאכותית (AI).
מותאמים ל-Google Cloud
בעזרת מודלים של Gemma ב-Google Cloud, ניתן להתאים אישית את המודל לצרכים הספציפיים שלכם בעזרת הכלים המנוהלים באופן מלא של Vertex AI או באמצעות האפשרות בניהול עצמי של GKE, ולפרוס אותו בתשתית גמישה וחסכונית שמותאמת ל-AI.
האצת מחקר אקדמי באמצעות קרדיטים ל-Google Cloud
תוכנית המחקר האקדמי סיימה לאחרונה את תקופת ההרשמה שלה והעניקה ל-Google Cloud קרדיטים כדי לתמוך בחוקרים שפורצים את גבולות הגילוי המדעי באמצעות מודלים של Gemma. אנחנו שמחים לראות את המחקר פורץ הדרך שעולה מהיוזמה הזו.
הצטרפות לקהילה
מתחברים, חוקרים ומשתפים את הידע שלכם עם אחרים בקהילת המודלים של למידת מכונה.