Gemini היא קבוצת מודלים של בינה מלאכותית גנרטיבית שמאפשרת למפתחים ליצור תוכן ולפתור בעיות. המודלים האלה מתוכננים ומאומנים לטפל גם בטקסט וגם בתמונות כקלט. המדריך הזה כולל מידע על כל וריאציה של הדגם, כדי להחליט איזו וריאציה הכי מתאימה לתרחיש לדוגמה שלכם.
השפות הזמינות
המודלים של Gemini מאומנים לעבודה עם השפות הבאות: {8/ {3/ Gemini), ערבית (3/ 3),
בנגאלית (bn
3), בנגאלית (bn
3), {200בנגאלית (bn
), בנגאלית (bn
2), {200{2/7} בנגאלית, {8/ 5}בצרפתית, {12/20}ar
bg
zh
hr
cs
da
nl
en
et
fi
fr
de
el
iw
hi
hu
id
it
ja
ko
lv
lt
no
pl
pt
ro
ru
sr
sk
sl
es
sw
sv
th
tr
uk
vi
מודלים של PaLM פועלים טוב רק באנגלית. שימוש בשפות אחרות עלול להוביל לתוצאות בלתי צפויות.
וריאציות של דגם
ב-Gemini API יש מודלים שונים שמותאמים לתרחישי שימוש ספציפיים. סקירה כללית קצרה של הווריאציות הזמינות של Gemini:
גרסת הדגם | קלט(קלט) | פלט | אופטימיזציה עבור |
---|---|---|---|
Gemini 1.5 Pro (תצוגה מקדימה) | אודיו, תמונות, סרטונים וטקסט | טקסט | סיבות למשימות, כולל, בין היתר, יצירת קוד וטקסט, עריכת טקסט, פתרון בעיות, חילוץ נתונים ויצירה |
Gemini 1.5 Flash (תצוגה מקדימה) | אודיו, תמונות, סרטונים וטקסט | טקסט | ביצועים מהירים ומגוונים במגוון משימות |
Gemini 1.0 Pro | טקסט | טקסט | משימות בשפה טבעית, צ'אט עם קוד וטקסט מרובה פניות ויצירת קודים |
Gemini 1.0 Pro Vision | תמונות, סרטונים וטקסט | טקסט | הביצועים עברו אופטימיזציה למשימות שקשורות מבחינה ויזואלית, כמו יצירת תיאורי תמונות או זיהוי אובייקטים בתמונות |
הטמעת טקסט | טקסט | הטמעות טקסט | יצירת הטמעות טקסט אלסטיות עם עד 768 מימדים לטקסט עם עד 2,048 אסימונים |
הטמעה | טקסט | הטמעות טקסט | יצירה של הטמעות טקסט עם 768 מימדים עבור טקסט שמכיל עד 2,048 אסימונים |
AQA | טקסט | טקסט | ביצוע משימות שקשורות למענה על שאלות שמשויכות לטקסט שסופק |
בטבלה הבאה מפורטים המאפיינים של המודלים של Gemini שמשותפים לכל הווריאציות של המודלים:
מאפיין | תיאור |
---|---|
נתוני אימון | המועד האחרון למילוי הידע של Gemini הוא בתחילת 2023. הידע על אירועים לאחר מועד זה מוגבל. |
שפות נתמכות | להצגת השפות הזמינות |
פרמטרים של מודל שניתן להגדיר |
|
מידע על כל אחד מהפרמטרים האלה מופיע במדריך בנושא מודלים גנרטיביים בקטע בנושא פרמטרים של מודלים.
Gemini 1.5 Pro (תצוגה מקדימה)
Gemini 1.5 Pro הוא מודל מרובה מצבים בגודל בינוני שמותאם למגוון רחב של משימות של הסקת מסקנות, כמו:
- יצירת קוד
- יצירת טקסט
- עריכת טקסט
- פתרון בעיות
- יצירת המלצות
- חילוץ מידע
- חילוץ או יצירה של נתונים
- יצירה של סוכני AI
1.5 Pro יכול לעבד כמויות גדולות של נתונים בו-זמנית, כולל שעה אחת של וידאו, 9.5 שעות של אודיו, קובצי קוד עם יותר מ-30,000 שורות קוד או יותר מ-700,000 מילים.
1.5 Pro יכול לטפל במשימות למידה מסוג אפס, חד-פעמיות וכמה דוגמאות.
פרטי דגם
מאפיין (property) | תיאור |
---|---|
קוד הדגם | models/gemini-1.5-pro-latest |
קלט | אודיו, תמונות, סרטונים וטקסט |
פלט | טקסט |
שיטות היצירה הנתמכות |
generateContent
|
מגבלת קלט לאסימונים[**] | 1,048,576 |
מגבלת אסימוני פלט[**] | 8,192 |
מספר תמונות מקסימלי לכל הנחיה | 3,600 |
אורך סרטון מקסימלי | שעה אחת |
אורך אודיו מקסימלי | כ-9.5 שעות |
המספר המקסימלי של קובצי אודיו בכל הנחיה | 1 |
בטיחות המודל | הגדרות בטיחות שמופעלות באופן אוטומטי וניתנות להתאמה על ידי המפתחים. לפרטים נוספים, אפשר לעיין בדף בנושא הגדרות בטיחות. |
מגבלות קצב של יצירת בקשות[*] |
|
הוראות מערכת | נתמך |
מצב JSON | נתמך |
הגרסה האחרונה | gemini-1.5-pro-latest |
הגרסה היציבה האחרונה | gemini-1.5-pro |
העדכון האחרון | אפריל 2024 |
Gemini 1.5 Flash (תצוגה מקדימה)
Gemini 1.5 Flash הוא מודל רב-אופני מהיר ורב-תכליתי שמאפשר לבצע התאמה לעומס (scaling) בין משימות מגוונות.
פרטי דגם
מאפיין (property) | תיאור |
---|---|
קוד הדגם | gemini-1.5-flash-latest |
קלט(קלט) | אודיו, תמונות, סרטונים וטקסט |
פלט | טקסט |
שיטות היצירה הנתמכות |
generateContent
|
מגבלת קלט לאסימונים[**] | 1,048,576 |
מגבלת אסימוני פלט[**] | 8,192 |
מספר תמונות מקסימלי לכל הנחיה | 3,600 |
אורך סרטון מקסימלי | שעה אחת |
אורך אודיו מקסימלי | כ-9.5 שעות |
המספר המקסימלי של קובצי אודיו בכל הנחיה | 1 |
בטיחות המודל | הגדרות בטיחות שמופעלות באופן אוטומטי וניתנות להתאמה על ידי המפתחים. לפרטים נוספים, אפשר לעיין בדף בנושא הגדרות בטיחות. |
מגבלות קצב של יצירת בקשות[*] |
|
הוראות מערכת | נתמך |
מצב JSON | נתמך |
הגרסה האחרונה | gemini-1.5-flash-latest |
הגרסה היציבה האחרונה | gemini-1.5-flash |
Gemini 1.0 Pro
Gemini 1.0 Pro הוא מודל NLP לטיפול במשימות כמו יצירת קוד ושליחת טקסט בצ'אט עם מספר פניות.
1.0 Pro יכול לטפל במשימות למידה מסוג אפס, חד-פעמיות וכמה דוגמאות.
פרטי דגם
מאפיין (property) | תיאור |
---|---|
קוד הדגם | models/gemini-pro |
קלט | טקסט |
פלט | טקסט |
שיטות היצירה הנתמכות |
generate_content
generateContent
|
מגבלות קצב של יצירת בקשות[*] |
|
הוראות מערכת | לא נתמך |
מצב JSON | לא נתמך |
הגרסה האחרונה | gemini-1.0-pro-latest |
הגרסה היציבה האחרונה | gemini-1.0-pro |
גרסאות יציבות | gemini-1.0-pro-001 |
העדכון האחרון | פברואר 2024 |
Gemini 1.0 Pro Vision
Gemini 1.0 Pro Vision הוא מודל רב-אופני שעבר אופטימיזציה לביצועים, ויכול לבצע משימות שקשורות ויזואלית. לדוגמה, 1.0 Pro Vision יכול ליצור תיאורי תמונות, לזהות אובייקטים שמופיעים בתמונות, לספק מידע על מקומות או אובייקטים שמופיעים בתמונות ועוד.
1.0 Pro Vision יכול לטפל במשימות מסוג אפס, חד-פעמיות וכמה דוגמאות.
פרטי דגם
מאפיין (property) | תיאור |
---|---|
קוד הדגם | models/gemini-pro-vision |
קלט | טקסט, סרטונים ותמונות |
פלט | טקסט |
שיטות היצירה הנתמכות |
generate_content
generateContent
|
מגבלת קלט לאסימון[*] | 12,288 |
מגבלת אסימון פלט[*] | 4,096 |
גודל תמונה מקסימלי | אין מגבלה |
מספר תמונות מקסימלי לכל הנחיה | 16 |
אורך סרטון מקסימלי | שתי דקות |
מספר סרטונים מקסימלי לכל הנחיה | 1 |
בטיחות המודל | הגדרות בטיחות שמופעלות באופן אוטומטי וניתנות להתאמה על ידי המפתחים. לפרטים נוספים, אפשר לעיין בדף בנושא הגדרות בטיחות. |
מגבלת קצב של יצירת בקשות[*] | 60 בקשות בדקה |
הגרסה האחרונה | gemini-1.0-pro-vision-latest |
הגרסה היציבה האחרונה | gemini-1.0-pro-vision |
העדכון האחרון | דצמבר 2023 |
הטמעה והטמעה של טקסט
הטמעת טקסט
אפשר להשתמש במודל 'הטמעת טקסט' כדי ליצור הטמעות טקסט לטקסט שהוזן. מידע נוסף על המודל 'הטמעת טקסט' זמין במסמכי התיעוד של AI גנרטיבי ב-Vertex AI.
המודל 'הטמעת טקסט' עבר אופטימיזציה ליצירת הטמעות עם 768 מידות לטקסט של עד 2,048 אסימונים. הטמעת טקסט מאפשרת הטמעה אלסטית בגדלים של עד 768. אפשר להשתמש בהטמעות אלסטיות כדי ליצור מידות פלט קטנות יותר ואולי לחסוך בעלויות מחשוב ואחסון עם הפסד קל של ביצועים.
פרטי דגם
מאפיין (property) | תיאור |
---|---|
קוד הדגם |
models/text-embedding-004
(text-embedding-preview-0409 ב-Vertex AI)
|
קלט | טקסט |
פלט | הטמעות טקסט |
מגבלת קלט לאסימונים | 2,048 |
גודל מידות הפלט | 768 |
שיטות היצירה הנתמכות |
embed_content
embedContent
|
בטיחות המודל | אין הגדרות בטיחות שניתן לשנות. |
מגבלת קצב של יצירת בקשות[*] | 1,500 בקשות לדקה |
העדכון האחרון | אפריל 2024 |
הטמעה
אפשר להשתמש במודל ההטמעה כדי ליצור הטמעות טקסט לטקסט שהוזן.
מודל ההטמעה עבר אופטימיזציה ליצירת הטמעות עם 768 מימדים לטקסט של עד 2,048 אסימונים.
פרטי המודל מטמיעים
מאפיין (property) | תיאור |
---|---|
קוד הדגם | models/embedding-001 |
קלט | טקסט |
פלט | הטמעות טקסט |
מגבלת קלט לאסימונים | 2,048 |
גודל מידות הפלט | 768 |
שיטות היצירה הנתמכות |
embed_content
embedContent
|
בטיחות המודל | אין הגדרות בטיחות שניתן לשנות. |
מגבלת קצב של יצירת בקשות[*] | 1,500 בקשות לדקה |
העדכון האחרון | דצמבר 2023 |
בקרת איכות
אפשר להשתמש במודל AQA כדי לבצע משימות שקשורות לתשובות לשאלות משויכות (AQA) במסמך, בקורפוס או בקבוצה של מעברים. מודל AQA מחזיר תשובות לשאלות שמתבססות על מקורות נתונים, וגם הערכה של ההסתברות שניתנת לתשובה.
פרטי דגם
מאפיין (property) | תיאור |
---|---|
קוד הדגם | models/aqa |
קלט | טקסט |
פלט | טקסט |
שיטות היצירה הנתמכות |
GenerateAnswerRequest
generateAnswer
|
שפות נתמכות | אנגלית |
מגבלת קלט לאסימונים[**] | 7,168 |
מגבלת אסימוני פלט[**] | 1,024 |
בטיחות המודל | הגדרות בטיחות שמופעלות באופן אוטומטי וניתנות להתאמה על ידי המפתחים. לפרטים נוספים, אפשר לעיין בדף בנושא הגדרות בטיחות. |
מגבלת קצב של יצירת בקשות[*] | 60 בקשות בדקה |
העדכון האחרון | דצמבר 2023 |
תוכלו להיעזר בדוגמאות כדי ללמוד על היכולות של הווריאציות האלה של המודל.
[*] אסימון מקביל לכ-4 תווים במודלים של Gemini. 100 אסימונים מכילים בערך 60-80 מילים באנגלית.
[**] RPM: בקשות לדקה
TPM: אסימונים לדקה
RPD: בקשות ליום
TPD: אסימונים ליום
בגלל מגבלות הקיבולת, לא מובטחות הגבלת קצב מקסימלית.
דפוסי השמות של גרסת המודל
המודלים של Gemini זמינים בגרסה תצוגה מקדימה או בגרסה יציבה. בקוד שלכם תוכלו להשתמש באחד מהפורמטים הבאים של שם המודל, כדי לציין באיזה דגם וגרסה אתם רוצים להשתמש.
העדכניות ביותר: מצביעה על הגרסה החדשנית של המודל ביחס לגנרציה ולגרסה מסוימת. המודל הבסיסי מתעדכן באופן קבוע, ויכול להיות שהוא גרסת תצוגה מקדימה. אפשר להשתמש בכתובת האימייל הזו רק באפליקציות של כלי הבדיקה ובגרסאות אב טיפוס של בדיקות.
כדי לציין את הגרסה העדכנית ביותר, משתמשים בדפוס הבא:
<model>-<generation>-<variation>-latest
. לדוגמה,gemini-1.0-pro-latest
.היציבות האחרונה: מצביעה על הגרסה היציבה האחרונה שנוצרה בשביל הגרסה והגנרציה של המודל שצוינו.
כדי לציין את הגרסה היציבה האחרונה משתמשים בתבנית הבאה:
<model>-<generation>-<variation>
. לדוגמה:gemini-1.0-pro
.יציב: מצביע על מודל יציב ספציפי. מודלים יציבים לא משתנים. לרוב האפליקציות בסביבת הייצור צריך להשתמש במודל יציב ספציפי.
כדי לציין גרסה יציבה משתמשים בדפוס הבא:
<model>-<generation>-<variation>-<version>
. לדוגמה,gemini-1.0-pro-001
.