תוכלו לעיין במאגר של Gemma Cookbook לקבלת דוגמאות ליצירה ולכוונון! מידע נוסף

דף זה תורגם על ידי Cloud Translation API.

Gemma Open Models

משפחה של מודלים פתוחים וקלים לשימוש, שנוצרו על סמך אותם מחקר וטכנולוגיה ששימשו ליצירת המודלים של Gemini

רוצים לנסות את Gemma 2 ב-Google AI Studio?

אחריות מובנית

המודלים האלה כוללים אמצעי בטיחות מקיפים, ומאפשרים להבטיח פתרונות AI אחראיים ואמינים באמצעות מערכי נתונים שנבחרו בקפידה ותהליך כוונון קפדני.

ביצועים ללא תחרות ביחס לגודל

המודלים של Gemma משיגים תוצאות יוצאות דופן במדדי השוואה (benchmark) בגדלים 2 מיליארד, 7 מיליארד, 9 מיליארד ו-27 מיליארד, ואף משיגים ביצועים טובים יותר ממודלים פתוחים גדולים יותר.

פריסה גמישה

פריסה חלקה לנייד, לאינטרנט ולענן באמצעות Keras,‏ JAX,‏ MediaPipe,‏ PyTorch,‏ Hugging Face ועוד.

כדאי לנסות את Gemma 2

Gemma 2 עוצבה מחדש כדי לספק ביצועים יוצאי דופן ויעילות שאין שני לה, והיא מבצעת אופטימיזציה להסקת מסקנות במהירות מסחררת בחומרה מגוונת.

רוצים לנסות את Gemma 2 ב-Google AI Studio?

5-shot

MMLU

מדד MMLU הוא בדיקה למדידת היקף הידע ויכולת פתרון הבעיות שמודלים גדולים של שפה צוברים במהלך אימון מקדים.

25 תמונות

ARC-C

מדד ARC-c הוא קבוצת משנה ממוקדת יותר של מערך הנתונים ARC-e, שמכילה רק שאלות שהאלגוריתמים הנפוצים (מבוססי אחזור ואירועים נלווים של מילים) לא הצליחו לענות עליהן נכון.

5-shot

GSM8K

במדד GSM8K נבדקת היכולת של מודל שפה לפתור בעיות מתמטיות ברמת בית הספר היסודי, שבדרך כלל דורשות כמה שלבים של חשיבה.

3-5-shot

AGIEval

בעזרת מדד AGIEval אפשר לבדוק את האינטליגנציה הכללית של מודל שפה באמצעות שאלות שמבוססות על בחינות מהעולם האמיתי שנועדו להעריך את היכולות האינטלקטואליות של בני אדם.

3-shot, CoT

BBH

מדד BBH (BIG-Bench Hard) מתמקד במשימות שנחשבות מעבר ליכולות של מודלים קיימים של שפה, ובוחן את המגבלות שלהם בתחומים שונים של הבנה והסקת מסקנות.

3 צילומים, F1

להתכופף

DROP הוא מדד למדידת הבנת הנקרא, שדורש חשיבה דיסקרטית על קטעים.

5-shot

Winogrande

בעזרת מדד Winogrande אפשר לבדוק את היכולת של מודל שפה לפתור משימות לא ברורות של מילוי החסר עם אפשרויות בינאריות, שדורשות חשיבה כללית לפי תחושת בטן.

10 צילומים

HellaSwag

בעזרת מדד HellaSwag אפשר לבדוק את היכולת של מודל שפה להבין וליישם את ההיגיון הבריא, על ידי בחירת הסיום הכי לוגי לסיפור.

4-shot

MATH

המדד MATH מעריך את היכולת של מודל שפה לפתור בעיות מילוליות מתמטיות מורכבות, שדורשות חשיבה, פתרון בעיות בכמה שלבים והבנה של מושגים מתמטיים.

0-shot

ARC-e

בעזרת מדד ARC-e אפשר לבדוק את היכולות המתקדמות של מודל שפה לענות על שאלות באמצעות שאלות אמריקאיות אמיתיות בנושאי מדע ברמת בית הספר היסודי.

0-shot

PIQA

בעזרת מדד PIQA אפשר לבדוק את היכולת של מודל שפה להבין ידע פיזי שכולל תחושה כללית ולהחיל אותו על ידי מענה על שאלות לגבי אינטראקציות פיזיות יומיומיות.

0-shot

SIQA

בעזרת מדד SIQA אפשר להעריך את ההבנה של מודל שפה בנוגע לאינטראקציות חברתיות ולשכל הישר החברתי. לשם כך, מוצגות שאלות לגבי הפעולות של אנשים וההשלכות החברתיות שלהן.

0-shot

Boolq

בעזרת אמת המידה BoolQ אפשר לבדוק את היכולת של מודל שפה לענות על שאלות מסוג כן/לא שמתרחשות באופן טבעי, ובכך לבדוק את היכולת של המודלים לבצע משימות של הסקת מסקנות משפה טבעית בעולם האמיתי.

5-shot

TriviaQA

במדד הביצועים של TriviaQA נבדקות מיומנויות הבנת הנקרא באמצעות טריופל של שאלה-תשובה-הוכחה.

5-shot

בדיקת העמידה בתקן NQ (שאלות טבעיות) בודקת את היכולת של מודל שפה למצוא תשובות בתוך מאמרים שלמים בוויקיפדיה ולהבין אותן, תוך סימולציה של תרחישים של מתן תשובות לשאלות בעולם האמיתי.

pass@1

HumanEval

בעזרת מדד HumanEval אפשר לבדוק את היכולות של מודל שפה ליצירת קוד. לשם כך, המערכת בודקת אם הפתרונות שלו עוברים בדיקות יחידה פונקציונליות לבעיות תכנות.

3 שוטים

MBPP

במדד MBPP נבדקת היכולת של מודל שפה לפתור בעיות תכנות בסיסיות ב-Python, תוך התמקדות במושגי תכנות בסיסיים ובשימוש בספריות סטנדרטיות.

100%

75%

50%

25%

100%

75%

50%

25%

Gemma 1

2.5 מיליארד

42.3

Gemma 2

2.6 מיליארד

51.3

Mistral

62.5

LLAMA 3

66.6

Gemma 1

64.4

Gemma 2

71.3

Gemma 2

27B

75.2

Gemma 1

2.5 מיליארד

48.5

Gemma 2

2.6 מיליארד

55.4

Mistral

60.5

LLAMA 3

59.2

Gemma 1

61.1

Gemma 2

68.4

Gemma 2

27B

71.4

Gemma 1

2.5 מיליארד

15.1

Gemma 2

2.6 מיליארד

23.9

Mistral

39.6

LLAMA 3

45.7

Gemma 1

51.8

Gemma 2

68.6

Gemma 2

27B

74.0

Gemma 1

2.5 מיליארד

24.2

Gemma 2

2.6 מיליארד

30.6

Mistral

44.0

LLAMA 3

45.9

Gemma 1

44.9

Gemma 2

52.8

Gemma 2

27B

55.1

Gemma 1

2.5 מיליארד

35.2

Gemma 2

2.6 מיליארד

41.9

Mistral

56.0

LLAMA 3

61.1

Gemma 1

59.0

Gemma 2

68.2

Gemma 2

27B

74.9

Gemma 1

2.5 מיליארד

48.5

Gemma 2

2.6 מיליארד

52.0

Mistral

63.8

LLAMA 3

58.4

Gemma 1

56.3

Gemma 2

69.4

Gemma 2

27B

74.2

Gemma 1

2.5 מיליארד

66.8

Gemma 2

2.6 מיליארד

70.9

Mistral

78.5

LLAMA 3

76.1

Gemma 1

79.0

Gemma 2

80.6

Gemma 2

27B

83.7

Gemma 1

2.5 מיליארד

71.7

Gemma 2

2.6 מיליארד

73.0

Mistral

83.0

LLAMA 3

82.0

Gemma 1

82.3

Gemma 2

81.9

Gemma 2

27B

86.4

Gemma 1

2.5 מיליארד

11.8

Gemma 2

2.6 מיליארד

15.0

Mistral

12.7

Gemma 1

24.3

Gemma 2

36.6

Gemma 2

27B

42.3

Gemma 1

2.5 מיליארד

73.2

Gemma 2

2.6 מיליארד

80.1

Mistral

80.5

Gemma 1

81.5

Gemma 2

88.0

Gemma 2

27B

88.6

Gemma 1

2.5 מיליארד

77.3

Gemma 2

2.6 מיליארד

77.8

Mistral

82.2

Gemma 1

81.2

Gemma 2

81.7

Gemma 2

27B

83.2

Gemma 1

2.5 מיליארד

49.7

Gemma 2

2.6 מיליארד

51.9

Mistral

47.0

Gemma 1

51.8

Gemma 2

53.4

Gemma 2

27B

53.7

Gemma 1

2.5 מיליארד

69.4

Gemma 2

2.6 מיליארד

72.5

Mistral

83.2

Gemma 1

83.2

Gemma 2

84.2

Gemma 2

27B

84.8

Gemma 1

2.5 מיליארד

53.2

Gemma 2

2.6 מיליארד

59.4

Mistral

62.5

Gemma 1

63.4

Gemma 2

76.6

Gemma 2

27B

83.7

Gemma 1

2.5 מיליארד

12.5

Gemma 2

2.6 מיליארד

16.7

Mistral

23.2

Gemma 1

23.0

Gemma 2

29.2

Gemma 2

27B

34.5

Gemma 1

2.5 מיליארד

22.0

Gemma 2

2.6 מיליארד

17.7

Mistral

26.2

Gemma 1

32.3

Gemma 2

40.2

Gemma 2

27B

51.8

Gemma 1

2.5 מיליארד

29.2

Gemma 2

2.6 מיליארד

29.6

Mistral

40.2

Gemma 1

44.4

Gemma 2

52.4

Gemma 2

27B

62.6

*אלה נקודות השוואה למודלים שהוכשרו מראש. בדוח הטכני מפורט מידע על הביצועים בשיטות אחרות.

קריאת הדוח הטכני

מודלים למחקר

היכרות עם משפחת הדגמים המורחבת של Gemma

הצגת כל הדגמים של Gemma

PaliGemma 2 חדש

PaliGemma 2 מאפשרת לשפר בקלות את יכולות הראייה של מודלים לשפה מסוג Gemma 2, וכך מאפשרת לפתח מגוון רחב של אפליקציות שמשלבות בין הבנת טקסט לבין הבנת תמונה.

הורדה מ-Kaggle

הורדה מ-Hugging Face

קריאת המסמכים

DataGemma

DataGemma הם המודלים הפתוחים הראשונים שנועדו לחבר מודלים של LLM לנתונים נרחבים מהעולם האמיתי, שנאספים מ-Data Commons של Google.

הורדה מ-Kaggle

הורדה מ-Hugging Face

קריאת המסמכים

היקף Gemma

Gemma Scope מספק לחוקרים שקיפות חסרת תקדים לגבי תהליכי קבלת ההחלטות של המודלים של Gemma 2.

הורדה מ-Hugging Face

קריאת מסמכים

Gemmaverse – עולם חדש של תכנים

סביבה רחבה של מודלים וכלים של Gemma שנוצרו על ידי הקהילה, שיעזרו לכם לחדש ולהתחדש

הצגת וריאנטים חיפוש מחברות

פיתוח פתרונות

תחילת העבודה עם Gemma

קריאת ספר המתכונים של Gemma

דוגמאות מעשיות ומדריכים למודלים הפתוחים של Google

הצגת מסמכי Notebook

פרצוף מחבק

במסמך ה-notebook הזה נסביר איך להתאים מודל Gemma-2 באמצעות DPO (אופטימיזציה לפי העדפות ישירות).

NVIDIA

שימוש ב-NVIDIA NeMo Framework לשיפור מודלים של Gemma וייצוא ל-TensorRT-LLM לצורכי ייצור.

Ollama

הפעלת הסקת מסקנות באופן מקומי במודל Gemma באמצעות Ollama.

Unsloth

איך משתמשים ב-UnSloth כדי לבצע התאמה אישית מהירה וחסכונית בזיכרון של Gemma 2 (9B)?

פריסת מודלים

בחירת יעד הפריסה

נייד

פריסה במכשיר באמצעות Google AI Edge

פריסת הפונקציות ישירות במכשירים כדי ליהנות מזמן אחזור קצר ופונקציונליות אופליין. מתאים במיוחד לאפליקציות שדורשות תגובה מיידית ופרטיות, כמו אפליקציות לנייד, מכשירי IoT ומערכות מוטמעות.

פריסה לנייד

אינטרנט