וריאציות של דגם
ב-Gemini API יש מודלים שונים שמותאמים לשימוש ספציפי במקרים שונים. סקירה כללית קצרה של הווריאציות הזמינות של Gemini:
גרסת הדגם | קלט(קלט) | פלט | אופטימיזציה עבור |
---|---|---|---|
Gemini 1.5 Pro
gemini-1.5-pro |
אודיו, תמונות, סרטונים וטקסט | טקסט | משימות מורכבות של הסקת מסקנות, כמו יצירת קוד וטקסט, עריכת טקסט, פתרון בעיות, חילוץ נתונים ויצירה שלהם |
Gemini 1.5 Flash
gemini-1.5-flash |
אודיו, תמונות, סרטונים וטקסט | טקסט | ביצועים מהירים ומגוונים במגוון משימות |
Gemini 1.0 Pro
gemini-1.0-pro |
טקסט | טקסט | משימות בשפה טבעית, צ'אט עם קוד וצ'אט במספר תורות וקוד ליצירת תמונות, |
(הוצאה משימוש) Gemini 1.0 Pro Vision
gemini-pro-vision
|
תמונות, סרטונים וטקסט | טקסט | משימות חזותיות, כמו יצירת תמונה תיאורים או זיהוי אובייקטים בתמונות |
הטמעת טקסט
text-embedding-004 |
טקסט | הטמעות טקסט | מדידת החיבור בין מחרוזות טקסט |
AQA
aqa |
טקסט | טקסט | מתן תשובות לשאלות מבוססות-מקור |
בטבלה הבאה מתוארים המאפיינים של המודלים של Gemini שמשותף לכל הווריאציות של המודל:
מאפיין | תיאור |
---|---|
נתוני אימון | המועד האחרון למימוש הידע של Gemini הוא נובמבר 2023. הידע על אירועים לאחר מועד זה מוגבל. |
שפות נתמכות | להצגת השפות הזמינות |
פרמטרים של מודל שניתן להגדיר |
|
לעיון בפרמטרים של המודל של גנרטיביים יכולים לספק מידע על כל אחד מהפרמטרים האלה.
פלאש Gemini 1.5
Gemini 1.5 Flash הוא מודל רב-אופני מהיר ורב-תכליתי שמאפשר לבצע התאמה לעומס (scaling) למשימות מגוונות.
פרטי דגם
נכס | תיאור |
---|---|
קוד המודל | models/gemini-1.5-flash |
את סוגי הנתונים הנתמכים |
קלט אודיו, תמונות, סרטונים וטקסט פלט טקסט |
[*] | מגבלות אסימון
מגבלת אסימוני קלט 1,048,576 מגבלת אסימוני פלט 8,192 |
מפרטים של תוכן אודיו/ויזואלי |
מספר תמונות מקסימלי לכל הנחיה 3,600 אורך סרטון מקסימלי שעה אחת אורך מקסימלי של אודיו כ-9.5 שעות |
[**] | מגבלות קצב
|
יכולות |
הוראות מערכת נתמך מצב JSON נתמך סכימת JSON לא נתמך הגדרות בטיחות ניתנות להתאמה נתמך שמירה במטמון נתמך כוונון לא נתמך שליחת פונקציות נתמך הגדרות קריאה לפונקציות נתמך הפעלת קוד נתמך |
העדכון האחרון | מאי 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro הוא מודל רב-אופני בינוני שמותאם במיוחד מגוון רחב של משימות של הסקת מסקנות. 1.5 Pro יכול לעבד כמויות גדולות של נתונים בו-זמנית, כולל שעתיים של וידאו, 19 שעות של אודיו, קודי בסיס עם 60,000 שורות קוד או 2,000 דפים של טקסט.
פרטי דגם
נכס | תיאור |
---|---|
קוד המודל | models/gemini-1.5-pro |
את סוגי הנתונים הנתמכים |
קלט אודיו, תמונות, סרטונים וטקסט פלט טקסט |
[*] | מגבלות אסימון
מגבלת אסימוני קלט 2,097,152 מגבלת אסימוני פלט 8,192 |
מפרטים של תוכן אודיו/ויזואלי |
מספר תמונות מקסימלי לכל הנחיה 7,200 אורך סרטון מקסימלי שעתיים אורך מקסימלי של אודיו בערך 19 שעות |
[**] | מגבלות קצב
|
יכולות |
הוראות מערכת נתמך מצב JSON נתמך סכימת JSON נתמך הגדרות בטיחות ניתנות להתאמה נתמך שמירה במטמון נתמך כוונון לא נתמך שליחת פונקציות נתמך הגדרות קריאה לפונקציות נתמך הפעלת קוד נתמך |
העדכון האחרון | מאי 2024 |
Gemini 1.0 Pro
Gemini 1.0 Pro הוא מודל NLP לטיפול במשימות כמו ניסוח טקסט מרובה פניות צ'אט בקוד ויצירת קוד.
פרטי דגם
נכס | תיאור |
---|---|
קוד המודל | models/gemini-1.0-pro |
את סוגי הנתונים הנתמכים |
קלט טקסט פלט טקסט |
[**] | מגבלות קצב
|
יכולות |
הוראות מערכת לא נתמך מצב JSON לא נתמך סכימת JSON לא נתמך הגדרות בטיחות ניתנות להתאמה נתמך שמירה במטמון לא נתמך כוונון נתמך שליחת פונקציות נתמך הגדרות קריאה לפונקציות לא נתמך הפעלת קוד לא נתמך |
העדכון האחרון | פברואר 2024 |
(הוצאה משימוש) Gemini 1.0 Pro Vision
Gemini 1.0 Pro Vision הוא מודל רב-אופני שמותאם לביצועים שיכול לבצע משימות שקשורות לרכיבים חזותיים. לדוגמה, 1.0 Pro Vision ליצור תיאורי תמונות, לזהות אובייקטים שקיימים בתמונות, לספק מידע על מקומות או אובייקטים שמופיעים בתמונות ועוד.
פרטי דגם
נכס | תיאור |
---|---|
קוד המודל | models/gemini-pro-vision |
את סוגי הנתונים הנתמכים |
קלט תמונות, סרטונים וטקסט פלט טקסט |
[*] | מגבלות אסימון
מגבלת אסימוני קלט 12,288 מגבלת אסימוני פלט 4,096 |
מפרטים של תוכן אודיו/ויזואלי |
אורך סרטון מקסימלי 2 דקות |
[**] | מגבלות קצב60 בקשות בדקה |
יכולות |
הוראות מערכת לא נתמך מצב JSON לא נתמך סכימת JSON לא נתמך הגדרות בטיחות ניתנות להתאמה נתמך שמירה במטמון לא נתמך כוונון לא נתמך שליחת פונקציות נתמך הגדרות קריאה לפונקציות לא נתמך הפעלת קוד לא נתמך |
העדכון האחרון | דצמבר 2023 |
הטמעה והטמעה של טקסט
הטמעת טקסט
אפשר להשתמש במודל 'הטמעת טקסט' כדי ליצור הטמעות טקסט בשביל של טקסט הקלט. למידע נוסף על המודל 'הטמעת טקסט', אפשר להיכנס אל מסמכי תיעוד של AI גנרטיבי ב-Vertex AI על הטמעות טקסט.
המודל 'הטמעת טקסט' עבר אופטימיזציה ליצירת הטמעות באמצעות 768. לטקסט של עד 2,048 אסימונים. הטמעת טקסט אלסטית גדולים פחות מ-768. אפשר להשתמש בהטמעות אלסטיות כדי ליצור מידות פלט קטנות יותר ועשויות לחסוך בעלויות מחשוב ואחסון עם פגיעה קלה בביצועים.
פרטי דגם
נכס | תיאור |
---|---|
קוד המודל |
Gemini API
|
את סוגי הנתונים הנתמכים |
קלט טקסט פלט הטמעות טקסט |
[*] | מגבלות אסימון
מגבלת אסימוני קלט 2,048 גודל מידות הפלט 768 |
[**] | מגבלות קצב1,500 בקשות לדקה |
הגדרות בטיחות ניתנות להתאמה | לא נתמך |
העדכון האחרון | אפריל 2024 |
הטמעה
אפשר להשתמש במודל ההטמעה כדי ליצור הטמעות טקסט בשביל של טקסט הקלט.
מודל ההטמעה עבר אופטימיזציה ליצירת הטמעות עם 768 מימדים לטקסט של עד 2,048 אסימונים.
פרטי המודל מטמיעים
נכס | תיאור |
---|---|
קוד המודל |
models/embedding-001
|
את סוגי הנתונים הנתמכים |
קלט טקסט פלט הטמעות טקסט |
[*] | מגבלות אסימון
מגבלת אסימוני קלט 2,048 גודל מידות הפלט 768 |
[**] | מגבלות קצב1,500 בקשות לדקה |
הגדרות בטיחות ניתנות להתאמה | לא נתמך |
העדכון האחרון | דצמבר 2023 |
בקרת איכות
אפשר להשתמש במודל AQA כדי לבצע מענה על שאלות משויכות (AQA) – משימות שקשורות למסמך, לקורפוס או לקבוצת מעברים. AQA מחזיר תשובות לשאלות שמבוססות על מקורות נתונים, וגם הערכה של ההסתברות שניתנת לתשובה.
פרטי דגם
נכס | תיאור |
---|---|
קוד המודל | models/aqa |
את סוגי הנתונים הנתמכים |
קלט טקסט פלט טקסט |
שפה נתמכת | אנגלית |
[*] | מגבלות אסימון
מגבלת אסימוני קלט 7,168 מגבלת אסימוני פלט 1,024 |
[**] | מגבלות קצב1,500 בקשות לדקה |
הגדרות בטיחות ניתנות להתאמה | נתמך |
העדכון האחרון | דצמבר 2023 |
כאן מפורטות דוגמאות ליכולות של המודלים האלה. שונות.
[*] אסימון מקביל לכ-4 תווים במודלים של Gemini. 100 אסימונים מורכבות מ-60-80 מילים באנגלית.
[**] הכנסה לאלף צפיות (RPM): בקשות לדקה
TPM: אסימונים לדקה
RPD: בקשות ביום
TPD: אסימונים ליום
עקב מגבלות הקיבולת, הגבלות הקצב של יצירת הבקשות המקסימליות שצוינו
מובטחת.
דפוסי השמות של גרסת המודל
המודלים של Gemini זמינים בגרסה תצוגה מקדימה או בגרסה יציבה. ב אפשר להשתמש באחד מהפורמטים הבאים של שם מודל כדי לציין ואת הגרסה שבה אתם רוצים להשתמש.
העדכני ביותר: מצביע על הגרסה החדשנית של המודל גנרטיבית ושונות. המודל הבסיסי מתעדכן באופן קבוע, להיות גרסת תצוגה מקדימה. יש להשתמש רק באפליקציות ובסוגים של בדיקות אקסקלוסיביות להשתמש בכינוי הזה.
כדי לציין את הגרסה העדכנית ביותר, צריך להשתמש בדפוס הבא:
<model>-<generation>-<variation>-latest
. לדוגמה,gemini-1.0-pro-latest
.היציבות האחרונה: מצביעה על הגרסה היציבה האחרונה שפורסמה של מודל טרנספורמר מסוים.
כדי לציין את הגרסה היציבה האחרונה, משתמשים בתבנית הבאה:
<model>-<generation>-<variation>
. לדוגמה,gemini-1.0-pro
.יציב: מצביע על מודל יציב ספציפי. מודלים יציבים לא משתנים. לרוב האפליקציות בסביבת הייצור צריך להשתמש במודל יציב ספציפי.
כדי לציין גרסה יציבה, משתמשים בדפוס הבא:
<model>-<generation>-<variation>-<version>
. לדוגמה,gemini-1.0-pro-001
.
השפות הזמינות
המודלים של Gemini מאומנים לפעול בשפות הבאות:
- ערבית (
ar
) - בנגלית (
bn
) - בולגרית (
bg
) - סינית (פשוטה ומסורתית) (
zh
) - קרואטית (
hr
) - צ'כית (
cs
) - דנית (
da
) - הולנדית (
nl
) - אנגלית (
en
) - אסטונית (
et
) - פינית (
fi
) - צרפתית (
fr
) - גרמנית (
de
) - יוונית (
el
) - עברית (
iw
) - הינדי (
hi
) - הונגרית (
hu
) - אינדונזית (
id
) - איטלקית (
it
) - יפנית (
ja
) - קוריאנית (
ko
) - לטבית (
lv
) - ליטאית (
lt
) - נורווגית (
no
) - פולנית (
pl
) - פורטוגזית (
pt
) - רומנית (
ro
) - רוסית (
ru
) - סרבית (
sr
) - סלובקית (
sk
) - סלובנית (
sl
) - ספרדית (
es
) - סווהילי (
sw
) - שוודית (
sv
) - תאית (
th
) - טורקית (
tr
) - אוקראינית (
uk
) - וייטנאמית (
vi
)