סמל של 'אחריות בכל שלבי התכנון'

אחריות מובנית

המודלים האלה כוללים אמצעי בטיחות מקיפים, ומאפשרים להבטיח פתרונות AI אחראיים ואמינים באמצעות מערכי נתונים שנבחרו בקפידה ותהליך כוונון קפדני.

סמל של ביצועים ללא תחרות

ביצועים ללא תחרות ביחס לגודל

המודלים של Gemma משיגים תוצאות יוצאות דופן במדדי השוואה (benchmark) בגדלים 2 מיליארד, 7 מיליארד, 9 מיליארד ו-27 מיליארד, ואף משיגים ביצועים טובים יותר ממודלים פתוחים גדולים יותר.

מסגרת גמישה

פריסה גמישה

פריסה חלקה לנייד, לאינטרנט ולענן באמצעות Keras,‏ JAX,‏ MediaPipe,‏ PyTorch,‏ Hugging Face ועוד.

כדאי לנסות את Gemma 2

Gemma 2 עוצבה מחדש כדי לספק ביצועים יוצאי דופן ויעילות שאין שני לה, והיא מבצעת אופטימיזציה להסקת מסקנות במהירות מסחררת בחומרה מגוונת.

5-shot

MMLU

מדד MMLU הוא בדיקה למדידת היקף הידע ויכולת פתרון הבעיות שמודלים גדולים של שפה צוברים במהלך אימון מקדים.

25 תמונות

ARC-C

מדד ARC-c הוא קבוצת משנה ממוקדת יותר של מערך הנתונים ARC-e, שמכילה רק שאלות שהאלגוריתמים הנפוצים (מבוססי אחזור ואירועים נלווים של מילים) לא הצליחו לענות עליהן נכון.

5-shot

GSM8K

במדד GSM8K נבדקת היכולת של מודל שפה לפתור בעיות מתמטיות ברמת בית הספר היסודי, שבדרך כלל דורשות כמה שלבים של חשיבה.

3-5-shot

AGIEval

בעזרת מדד AGIEval אפשר לבדוק את האינטליגנציה הכללית של מודל שפה באמצעות שאלות שמבוססות על בחינות מהעולם האמיתי שנועדו להעריך את היכולות האינטלקטואליות של בני אדם.

3-shot, CoT

BBH

מדד BBH (BIG-Bench Hard) מתמקד במשימות שנחשבות מעבר ליכולות של מודלים קיימים של שפה, ובוחן את המגבלות שלהם בתחומים שונים של הבנה והסקת מסקנות.

3 צילומים, F1

להתכופף

DROP הוא מדד למדידת הבנת הנקרא, שדורש חשיבה דיסקרטית על קטעים.

5-shot

Winogrande

בעזרת מדד Winogrande אפשר לבדוק את היכולת של מודל שפה לפתור משימות לא ברורות של מילוי החסר עם אפשרויות בינאריות, שדורשות חשיבה כללית לפי תחושת בטן.

10 צילומים

HellaSwag

בעזרת מדד HellaSwag אפשר לבדוק את היכולת של מודל שפה להבין וליישם את ההיגיון הבריא, על ידי בחירת הסיום הכי לוגי לסיפור.

4-shot

MATH

המדד MATH מעריך את היכולת של מודל שפה לפתור בעיות מילוליות מתמטיות מורכבות, שדורשות חשיבה, פתרון בעיות בכמה שלבים והבנה של מושגים מתמטיים.

0-shot

ARC-e

בעזרת מדד ARC-e אפשר לבדוק את היכולות המתקדמות של מודל שפה לענות על שאלות באמצעות שאלות אמריקאיות אמיתיות בנושאי מדע ברמת בית הספר היסודי.

0-shot

PIQA

בעזרת מדד PIQA אפשר לבדוק את היכולת של מודל שפה להבין ידע פיזי שכולל תחושה כללית ולהחיל אותו על ידי מענה על שאלות לגבי אינטראקציות פיזיות יומיומיות.

0-shot

SIQA

בעזרת מדד SIQA אפשר להעריך את ההבנה של מודל שפה בנוגע לאינטראקציות חברתיות ולשכל הישר החברתי. לשם כך, מוצגות שאלות לגבי הפעולות של אנשים וההשלכות החברתיות שלהן.

0-shot

Boolq

בעזרת אמת המידה BoolQ אפשר לבדוק את היכולת של מודל שפה לענות על שאלות מסוג כן/לא שמתרחשות באופן טבעי, ובכך לבדוק את היכולת של המודלים לבצע משימות של הסקת מסקנות משפה טבעית בעולם האמיתי.

5-shot

TriviaQA

במדד הביצועים של TriviaQA נבדקות מיומנויות הבנת הנקרא באמצעות טריופל של שאלה-תשובה-הוכחה.

5-shot

NQ

בדיקת העמידה בתקן NQ (שאלות טבעיות) בודקת את היכולת של מודל שפה למצוא תשובות בתוך מאמרים שלמים בוויקיפדיה ולהבין אותן, תוך סימולציה של תרחישים של מתן תשובות לשאלות בעולם האמיתי.

pass@1

HumanEval

בעזרת מדד HumanEval אפשר לבדוק את היכולות של מודל שפה ליצירת קוד. לשם כך, המערכת בודקת אם הפתרונות שלו עוברים בדיקות יחידה פונקציונליות לבעיות תכנות.

3 שוטים

MBPP

במדד MBPP נבדקת היכולת של מודל שפה לפתור בעיות תכנות בסיסיות ב-Python, תוך התמקדות במושגי תכנות בסיסיים ובשימוש בספריות סטנדרטיות.

100%

75%

50%

25%

0%

100%

75%

50%

25%

0%

Gemma 1

2.5 מיליארד

42.3

Gemma 2

2.6 מיליארד

51.3

Mistral

7B

62.5

LLAMA 3

8B

66.6

Gemma 1

7B

64.4

Gemma 2

9B

71.3

Gemma 2

27B

75.2

Gemma 1

2.5 מיליארד

48.5

Gemma 2

2.6 מיליארד

55.4

Mistral

7B

60.5

LLAMA 3

8B

59.2

Gemma 1

7B

61.1

Gemma 2

9B

68.4

Gemma 2

27B

71.4

Gemma 1

2.5 מיליארד

15.1

Gemma 2

2.6 מיליארד

23.9

Mistral

7B

39.6

LLAMA 3

8B

45.7

Gemma 1

7B

51.8

Gemma 2

9B

68.6

Gemma 2

27B

74.0

Gemma 1

2.5 מיליארד

24.2

Gemma 2

2.6 מיליארד

30.6

Mistral

7B

44.0

LLAMA 3

8B

45.9

Gemma 1

7B

44.9

Gemma 2

9B

52.8

Gemma 2

27B

55.1

Gemma 1

2.5 מיליארד

35.2

Gemma 2

2.6 מיליארד

41.9

Mistral

7B

56.0

LLAMA 3

8B

61.1

Gemma 1

7B

59.0

Gemma 2

9B

68.2

Gemma 2

27B

74.9

Gemma 1

2.5 מיליארד

48.5

Gemma 2

2.6 מיליארד

52.0

Mistral

7B

63.8

LLAMA 3

8B

58.4

Gemma 1

7B

56.3

Gemma 2

9B

69.4

Gemma 2

27B

74.2

Gemma 1

2.5 מיליארד

66.8

Gemma 2

2.6 מיליארד

70.9

Mistral

7B

78.5

LLAMA 3

8B

76.1

Gemma 1

7B

79.0

Gemma 2

9B

80.6

Gemma 2

27B

83.7

Gemma 1

2.5 מיליארד

71.7

Gemma 2

2.6 מיליארד

73.0

Mistral

7B

83.0

LLAMA 3

8B

82.0

Gemma 1

7B

82.3

Gemma 2

9B

81.9

Gemma 2

27B

86.4

Gemma 1

2.5 מיליארד

11.8

Gemma 2

2.6 מיליארד

15.0

Mistral

7B

12.7

Gemma 1

7B

24.3

Gemma 2

9B

36.6

Gemma 2

27B

42.3

Gemma 1

2.5 מיליארד

73.2

Gemma 2

2.6 מיליארד

80.1

Mistral

7B

80.5

Gemma 1

7B

81.5

Gemma 2

9B

88.0

Gemma 2

27B

88.6

Gemma 1

2.5 מיליארד

77.3

Gemma 2

2.6 מיליארד

77.8

Mistral

7B

82.2

Gemma 1

7B

81.2

Gemma 2

9B

81.7

Gemma 2

27B

83.2

Gemma 1

2.5 מיליארד

49.7

Gemma 2

2.6 מיליארד

51.9

Mistral

7B

47.0

Gemma 1

7B

51.8

Gemma 2

9B

53.4

Gemma 2

27B

53.7

Gemma 1

2.5 מיליארד

69.4

Gemma 2

2.6 מיליארד

72.5

Mistral

7B

83.2

Gemma 1

7B

83.2

Gemma 2

9B

84.2

Gemma 2

27B

84.8

Gemma 1

2.5 מיליארד

53.2

Gemma 2

2.6 מיליארד

59.4

Mistral

7B

62.5

Gemma 1

7B

63.4

Gemma 2

9B

76.6

Gemma 2

27B

83.7

Gemma 1

2.5 מיליארד

12.5

Gemma 2

2.6 מיליארד

16.7

Mistral

7B

23.2

Gemma 1

7B

23.0

Gemma 2

9B

29.2

Gemma 2

27B

34.5

Gemma 1

2.5 מיליארד

22.0

Gemma 2

2.6 מיליארד

17.7

Mistral

7B

26.2

Gemma 1

7B

32.3

Gemma 2

9B

40.2

Gemma 2

27B

51.8

Gemma 1

2.5 מיליארד

29.2

Gemma 2

2.6 מיליארד

29.6

Mistral

7B

40.2

Gemma 1

7B

44.4

Gemma 2

9B

52.4

Gemma 2

27B

62.6

*אלה נקודות השוואה למודלים שהוכשרו מראש. בדוח הטכני מפורט מידע על הביצועים בשיטות אחרות.

PaliGemma 2 חדש

PaliGemma 2 מאפשרת לשפר בקלות את יכולות הראייה של מודלים לשפה מסוג Gemma 2, וכך מאפשרת לפתח מגוון רחב של אפליקציות שמשלבות בין הבנת טקסט לבין הבנת תמונה.

DataGemma

DataGemma הם המודלים הפתוחים הראשונים שנועדו לחבר מודלים של LLM לנתונים נרחבים מהעולם האמיתי, שנאספים מ-Data Commons של Google.

היקף Gemma

Gemma Scope מספק לחוקרים שקיפות חסרת תקדים לגבי תהליכי קבלת ההחלטות של המודלים של Gemma 2.

פריסת מודלים

בחירת יעד הפריסה

סמל הפריסה לניידנייד

פריסה במכשיר באמצעות Google AI Edge

פריסת הפונקציות ישירות במכשירים כדי ליהנות מזמן אחזור קצר ופונקציונליות אופליין. מתאים במיוחד לאפליקציות שדורשות תגובה מיידית ופרטיות, כמו אפליקציות לנייד, מכשירי IoT ומערכות מוטמעות.

סמל האינטרנטאינטרנט

שילוב חלק באפליקציות אינטרנט

שדרוג האתרים ושירותי האינטרנט שלכם באמצעות יכולות AI מתקדמות, שמאפשרות תכונות אינטראקטיביות, תוכן מותאם אישית ואוטומציה חכמה.

סמל של ענןCloud

התאמה לעומס בקלות באמצעות תשתית ענן

נצלו את הגמישות וההתאמה לעומס של הענן כדי לטפל בפריסות בקנה מידה רחב, בעומסי עבודה כבדים ובאפליקציות AI מורכבות.

ביטול הנעילה של התקשורת הגלובלית

הצטרפו לתחרות הגלובלית שלנו ב-Kaggle. יצירת וריאנטים של מודלים של Gemma לשפה ספציפית או לאספקט תרבותי ייחודי