וריאציות של דגם
ב-Gemini API יש מודלים שונים שמותאמים לתרחישי שימוש ספציפיים. סקירה כללית קצרה של הווריאציות הזמינות של Gemini:
גרסת הדגם | קלט(קלט) | פלט | אופטימיזציה עבור |
---|---|---|---|
Gemini 1.5 Pro
gemini-1.5-pro |
אודיו, תמונות, סרטונים וטקסט | טקסט | משימות מורכבות של הסקת מסקנות, כמו יצירת קוד וטקסט, עריכת טקסט, פתרון בעיות, חילוץ נתונים ויצירה של נתונים |
Gemini 1.5 Flash
gemini-1.5-flash |
אודיו, תמונות, סרטונים וטקסט | טקסט | ביצועים מהירים ומגוונים במגוון משימות |
Gemini 1.0 Pro
gemini-1.0-pro |
טקסט | טקסט | משימות בשפה טבעית, צ'אט עם קוד וטקסט מרובה פניות ויצירת קודים |
(הוצאה משימוש) Gemini 1.0 Pro Vision
gemini-pro-vision
|
תמונות, סרטונים וטקסט | טקסט | משימות חזותיות, כמו יצירת תיאורי תמונות או זיהוי אובייקטים בתמונות |
הטמעת טקסט
text-embedding-004 |
טקסט | הטמעות טקסט | מדידת החיבור בין מחרוזות טקסט |
AQA
aqa |
טקסט | טקסט | מתן תשובות לשאלות מבוססות-מקור |
בטבלה הבאה מפורטים המאפיינים של המודלים של Gemini שמשותפים לכל הווריאציות של המודלים:
מאפיין | תיאור |
---|---|
נתוני אימון | המועד האחרון למימוש הידע של Gemini הוא נובמבר 2023. הידע על אירועים לאחר מועד זה מוגבל. |
שפות נתמכות | להצגת השפות הזמינות |
פרמטרים של מודל שניתן להגדיר |
|
מידע על כל אחד מהפרמטרים האלה מופיע במדריך בנושא מודלים גנרטיביים בקטע בנושא פרמטרים של מודלים.
פלאש Gemini 1.5
Gemini 1.5 Flash הוא מודל רב-אופני מהיר ורב-תכליתי שמאפשר לבצע התאמה לעומס (scaling) בין משימות מגוונות.
פרטי דגם
מאפיין (property) | תיאור |
---|---|
קוד המודל | models/gemini-1.5-flash |
את סוגי הנתונים הנתמכים |
קלט אודיו, תמונות, סרטונים וטקסט פלט טקסט |
[*] | מגבלות אסימון
מגבלת אסימוני קלט 1,048,576 מגבלת אסימוני פלט 8,192 |
מפרטים של תוכן אודיו/ויזואלי |
מספר תמונות מקסימלי לכל הנחיה 3,600 אורך סרטון מקסימלי שעה אחת אורך מקסימלי של אודיו כ-9.5 שעות |
[**] | מגבלות קצב
|
יכולות |
הוראות מערכת נתמך מצב JSON נתמך סכימת JSON לא נתמך הגדרות בטיחות ניתנות להתאמה נתמך שמירה במטמון נתמך כוונון לא נתמך שליחת פונקציות נתמך הגדרות קריאה לפונקציות נתמך הפעלת קוד נתמך |
העדכון האחרון | מאי 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro הוא מודל מרובה מצבים בגודל בינוני שמותאם למגוון רחב של משימות של הסקת מסקנות. 1.5 Pro יכול לעבד כמויות גדולות של נתונים בו-זמנית, כולל שעתיים של וידאו, 19 שעות של אודיו, רכיבי קוד עם 60,000 שורות קוד או 2,000 עמודים של טקסט.
פרטי דגם
מאפיין (property) | תיאור |
---|---|
קוד המודל | models/gemini-1.5-pro |
את סוגי הנתונים הנתמכים |
קלט אודיו, תמונות, סרטונים וטקסט פלט טקסט |
[*] | מגבלות אסימון
מגבלת אסימוני קלט 2,097,152 מגבלת אסימוני פלט 8,192 |
מפרטים של תוכן אודיו/ויזואלי |
מספר תמונות מקסימלי לכל הנחיה 7,200 אורך סרטון מקסימלי שעתיים אורך מקסימלי של אודיו בערך 19 שעות |
[**] | מגבלות קצב
|
יכולות |
הוראות מערכת נתמך מצב JSON נתמך סכימת JSON נתמך הגדרות בטיחות ניתנות להתאמה נתמך שמירה במטמון נתמך כוונון לא נתמך שליחת פונקציות נתמך הגדרות קריאה לפונקציות נתמך הפעלת קוד נתמך |
העדכון האחרון | מאי 2024 |
Gemini 1.0 Pro
Gemini 1.0 Pro הוא מודל NLP לטיפול במשימות כמו יצירת קוד ושליחת טקסט בצ'אט עם מספר פניות.
פרטי דגם
מאפיין (property) | תיאור |
---|---|
קוד המודל | models/gemini-1.0-pro |
את סוגי הנתונים הנתמכים |
קלט טקסט פלט טקסט |
[**] | מגבלות קצב
|
יכולות |
הוראות מערכת לא נתמך מצב JSON לא נתמך סכימת JSON לא נתמך הגדרות בטיחות ניתנות להתאמה נתמך שמירה במטמון לא נתמך כוונון נתמך שליחת פונקציות נתמך הגדרות קריאה לפונקציות לא נתמך הפעלת קוד לא נתמך |
העדכון האחרון | פברואר 2024 |
(הוצאה משימוש) Gemini 1.0 Pro Vision
Gemini 1.0 Pro Vision הוא מודל רב-אופני שעבר אופטימיזציה לביצועים, ויכול לבצע משימות שקשורות ויזואלית. לדוגמה, 1.0 Pro Vision יכול ליצור תיאורי תמונות, לזהות אובייקטים שמופיעים בתמונות, לספק מידע על מקומות או אובייקטים שמופיעים בתמונות ועוד.
פרטי דגם
מאפיין (property) | תיאור |
---|---|
קוד המודל | models/gemini-pro-vision |
את סוגי הנתונים הנתמכים |
קלט תמונות, סרטונים וטקסט פלט טקסט |
[*] | מגבלות אסימון
מגבלת אסימוני קלט 12,288 מגבלת אסימוני פלט 4,096 |
מפרטים של תוכן אודיו/ויזואלי |
אורך סרטון מקסימלי שתי דקות |
[**] | מגבלות קצב60 בקשות בדקה |
יכולות |
הוראות מערכת לא נתמך מצב JSON לא נתמך סכימת JSON לא נתמך הגדרות בטיחות ניתנות להתאמה נתמך שמירה במטמון לא נתמך כוונון לא נתמך שליחת פונקציות נתמך הגדרות קריאה לפונקציות לא נתמך הפעלת קוד לא נתמך |
העדכון האחרון | דצמבר 2023 |
הטמעה והטמעה של טקסט
הטמעת טקסט
אפשר להשתמש במודל 'הטמעת טקסט' כדי ליצור הטמעות טקסט לטקסט שהוזן. מידע נוסף על המודל 'הטמעת טקסט' זמין במסמכי התיעוד של AI גנרטיבי ב-Vertex AI.
המודל 'הטמעת טקסט' עבר אופטימיזציה ליצירת הטמעות עם 768 מידות לטקסט של עד 2,048 אסימונים. הטמעת טקסט מאפשרת הטמעה אלסטית בגדלים של עד 768. אפשר להשתמש בהטמעות אלסטיות כדי ליצור מידות פלט קטנות יותר ואולי לחסוך בעלויות מחשוב ואחסון עם הפסד קל של ביצועים.
פרטי דגם
מאפיין (property) | תיאור |
---|---|
קוד המודל |
Gemini API
|
את סוגי הנתונים הנתמכים |
קלט טקסט פלט הטמעות טקסט |
[*] | מגבלות אסימון
מגבלת אסימוני קלט 2,048 גודל מידות הפלט 768 |
[**] | מגבלות קצב1,500 בקשות לדקה |
הגדרות בטיחות ניתנות להתאמה | לא נתמך |
העדכון האחרון | אפריל 2024 |
הטמעה
אפשר להשתמש במודל ההטמעה כדי ליצור הטמעות טקסט לטקסט שהוזן.
מודל ההטמעה עבר אופטימיזציה ליצירת הטמעות עם 768 מימדים לטקסט של עד 2,048 אסימונים.
פרטי המודל מטמיעים
מאפיין (property) | תיאור |
---|---|
קוד המודל |
models/embedding-001
|
את סוגי הנתונים הנתמכים |
קלט טקסט פלט הטמעות טקסט |
[*] | מגבלות אסימון
מגבלת אסימוני קלט 2,048 גודל מידות הפלט 768 |
[**] | מגבלות קצב1,500 בקשות לדקה |
הגדרות בטיחות ניתנות להתאמה | לא נתמך |
העדכון האחרון | דצמבר 2023 |
בקרת איכות
אפשר להשתמש במודל AQA כדי לבצע משימות שקשורות לתשובות לשאלות משויכות (AQA) במסמך, בקורפוס או בקבוצה של מעברים. מודל AQA מחזיר תשובות לשאלות שמתבססות על מקורות נתונים, וגם הערכה של ההסתברות שניתנת לתשובה.
פרטי דגם
מאפיין (property) | תיאור |
---|---|
קוד המודל | models/aqa |
את סוגי הנתונים הנתמכים |
קלט טקסט פלט טקסט |
שפה נתמכת | אנגלית |
[*] | מגבלות אסימון
מגבלת אסימוני קלט 7,168 מגבלת אסימוני פלט 1,024 |
[**] | מגבלות קצב1,500 בקשות לדקה |
הגדרות בטיחות ניתנות להתאמה | נתמך |
העדכון האחרון | דצמבר 2023 |
תוכלו להיעזר בדוגמאות כדי ללמוד על היכולות של הווריאציות האלה של המודל.
[*] אסימון מקביל לכ-4 תווים במודלים של Gemini. 100 אסימונים מכילים בערך 60-80 מילים באנגלית.
[**] RPM: בקשות לדקה
TPM: אסימונים לדקה
RPD: בקשות ליום
TPD: אסימונים ליום
בגלל מגבלות הקיבולת, לא מובטחות הגבלת קצב מקסימלית.
דפוסי השמות של גרסת המודל
המודלים של Gemini זמינים בגרסה תצוגה מקדימה או בגרסה יציבה. בקוד שלכם תוכלו להשתמש באחד מהפורמטים הבאים של שם המודל, כדי לציין באיזה דגם וגרסה אתם רוצים להשתמש.
העדכניות ביותר: מצביעה על הגרסה החדשנית של המודל ביחס לגנרציה ולגרסה מסוימת. המודל הבסיסי מתעדכן באופן קבוע, ויכול להיות שהוא גרסת תצוגה מקדימה. אפשר להשתמש בכתובת האימייל הזו רק באפליקציות של כלי הבדיקה ובגרסאות אב טיפוס של בדיקות.
כדי לציין את הגרסה העדכנית ביותר, משתמשים בדפוס הבא:
<model>-<generation>-<variation>-latest
. לדוגמה,gemini-1.0-pro-latest
.היציבות האחרונה: מצביעה על הגרסה היציבה האחרונה שנוצרה בשביל הגרסה והגנרציה של המודל שצוינו.
כדי לציין את הגרסה היציבה האחרונה משתמשים בתבנית הבאה:
<model>-<generation>-<variation>
. לדוגמה:gemini-1.0-pro
.יציב: מצביע על מודל יציב ספציפי. מודלים יציבים לא משתנים. לרוב האפליקציות בסביבת הייצור צריך להשתמש במודל יציב ספציפי.
כדי לציין גרסה יציבה משתמשים בדפוס הבא:
<model>-<generation>-<variation>-<version>
. לדוגמה,gemini-1.0-pro-001
.
השפות הזמינות
המודלים של Gemini מאומנים לפעול בשפות הבאות:
- ערבית (
ar
) - בנגלית (
bn
) - בולגרית (
bg
) - סינית (פשוטה ומסורתית) (
zh
) - קרואטית (
hr
) - צ'כית (
cs
) - דנית (
da
) - הולנדית (
nl
) - אנגלית (
en
) - אסטונית (
et
) - פינית (
fi
) - צרפתית (
fr
) - גרמנית (
de
) - יוונית (
el
) - עברית (
iw
) - הינדי (
hi
) - הונגרית (
hu
) - אינדונזית (
id
) - איטלקית (
it
) - יפנית (
ja
) - קוריאנית (
ko
) - לטבית (
lv
) - ליטאית (
lt
) - נורווגית (
no
) - פולנית (
pl
) - פורטוגזית (
pt
) - רומנית (
ro
) - רוסית (
ru
) - סרבית (
sr
) - סלובקית (
sk
) - סלובנית (
sl
) - ספרדית (
es
) - סווהילי (
sw
) - שוודית (
sv
) - תאית (
th
) - טורקית (
tr
) - אוקראינית (
uk
) - וייטנאמית (
vi
)