Gemini

וריאציות של דגם

ב-Gemini API יש מודלים שונים שמותאמים לשימוש ספציפי במקרים שונים. סקירה כללית קצרה של הווריאציות הזמינות של Gemini:

גרסת הדגם קלט(קלט) פלט אופטימיזציה עבור
Gemini 1.5 Pro
gemini-1.5-pro
אודיו, תמונות, סרטונים וטקסט טקסט משימות מורכבות של הסקת מסקנות, כמו יצירת קוד וטקסט, עריכת טקסט, פתרון בעיות, חילוץ נתונים ויצירה שלהם
Gemini 1.5 Flash
gemini-1.5-flash
אודיו, תמונות, סרטונים וטקסט טקסט ביצועים מהירים ומגוונים במגוון משימות
Gemini 1.0 Pro
gemini-1.0-pro
טקסט טקסט משימות בשפה טבעית, צ'אט עם קוד וצ'אט במספר תורות וקוד ליצירת תמונות,
(הוצאה משימוש) Gemini 1.0 Pro Vision
gemini-pro-vision
תמונות, סרטונים וטקסט טקסט משימות חזותיות, כמו יצירת תמונה תיאורים או זיהוי אובייקטים בתמונות
הטמעת טקסט
text-embedding-004
טקסט הטמעות טקסט מדידת החיבור בין מחרוזות טקסט
AQA
aqa
טקסט טקסט מתן תשובות לשאלות מבוססות-מקור

בטבלה הבאה מתוארים המאפיינים של המודלים של Gemini שמשותף לכל הווריאציות של המודל:

מאפיין תיאור
נתוני אימון המועד האחרון למימוש הידע של Gemini הוא נובמבר 2023. הידע על אירועים לאחר מועד זה מוגבל.
שפות נתמכות להצגת השפות הזמינות
פרמטרים של מודל שניתן להגדיר
  • המיקום העליון
  • K מובילים
  • טמפרטורה
  • הפסקת הרצף
  • אורך פלט מקסימלי
  • מספר התשובות האפשריות

לעיון בפרמטרים של המודל של גנרטיביים יכולים לספק מידע על כל אחד מהפרמטרים האלה.

פלאש Gemini 1.5

Gemini 1.5 Flash הוא מודל רב-אופני מהיר ורב-תכליתי שמאפשר לבצע התאמה לעומס (scaling) למשימות מגוונות.

להתנסות ב-AI Studio

פרטי דגם

נכס תיאור
קוד המודל models/gemini-1.5-flash
את סוגי הנתונים הנתמכים

קלט

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

1,048,576

מגבלת אסימוני פלט

8,192

מפרטים של תוכן אודיו/ויזואלי

מספר תמונות מקסימלי לכל הנחיה

3,600

אורך סרטון מקסימלי

שעה אחת

אורך מקסימלי של אודיו

כ-9.5 שעות

מגבלות קצב[**]
בחינם:
  • 15 סל״ד
  • מיליון מודולי פלטפורמה מהימנים (TPM)
  • 1,500 RPD
Pay-as-you-go:
  • 1,000 סל״ד
  • 2 מיליון מודולי פלטפורמה מהימנים (TPM)
יכולות

הוראות מערכת

נתמך

מצב JSON

נתמך

סכימת JSON

לא נתמך

הגדרות בטיחות ניתנות להתאמה

נתמך

שמירה במטמון

נתמך

כוונון

לא נתמך

שליחת פונקציות

נתמך

הגדרות קריאה לפונקציות

נתמך

הפעלת קוד

נתמך

העדכון האחרון מאי 2024

Gemini 1.5 Pro

Gemini 1.5 Pro הוא מודל רב-אופני בינוני שמותאם במיוחד מגוון רחב של משימות של הסקת מסקנות. 1.5 Pro יכול לעבד כמויות גדולות של נתונים בו-זמנית, כולל שעתיים של וידאו, 19 שעות של אודיו, קודי בסיס עם 60,000 שורות קוד או 2,000 דפים של טקסט.

להתנסות ב-AI Studio

פרטי דגם

נכס תיאור
קוד המודל models/gemini-1.5-pro
את סוגי הנתונים הנתמכים

קלט

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

2,097,152

מגבלת אסימוני פלט

8,192

מפרטים של תוכן אודיו/ויזואלי

מספר תמונות מקסימלי לכל הנחיה

7,200

אורך סרטון מקסימלי

שעתיים

אורך מקסימלי של אודיו

בערך 19 שעות

מגבלות קצב[**]
בחינם:
  • 2 סיבובים לדקה
  • 32,000 TPM
  • RPD 50
Pay-as-you-go:
  • 360 סל״ד
  • 2 מיליון מודולי פלטפורמה מהימנים (TPM)
  • 10,000 RPD
יכולות

הוראות מערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות ניתנות להתאמה

נתמך

שמירה במטמון

נתמך

כוונון

לא נתמך

שליחת פונקציות

נתמך

הגדרות קריאה לפונקציות

נתמך

הפעלת קוד

נתמך

העדכון האחרון מאי 2024

Gemini 1.0 Pro

Gemini 1.0 Pro הוא מודל NLP לטיפול במשימות כמו ניסוח טקסט מרובה פניות צ'אט בקוד ויצירת קוד.

להתנסות ב-AI Studio

פרטי דגם

נכס תיאור
קוד המודל models/gemini-1.0-pro
את סוגי הנתונים הנתמכים

קלט

טקסט

פלט

טקסט

מגבלות קצב[**]
בחינם:
  • 15 סל״ד
  • 32,000 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 360 סל״ד
  • 120,000 TPM
  • 30,000 RPD
יכולות

הוראות מערכת

לא נתמך

מצב JSON

לא נתמך

סכימת JSON

לא נתמך

הגדרות בטיחות ניתנות להתאמה

נתמך

שמירה במטמון

לא נתמך

כוונון

נתמך

שליחת פונקציות

נתמך

הגדרות קריאה לפונקציות

לא נתמך

הפעלת קוד

לא נתמך

העדכון האחרון פברואר 2024

(הוצאה משימוש) Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision הוא מודל רב-אופני שמותאם לביצועים שיכול לבצע משימות שקשורות לרכיבים חזותיים. לדוגמה, 1.0 Pro Vision ליצור תיאורי תמונות, לזהות אובייקטים שקיימים בתמונות, לספק מידע על מקומות או אובייקטים שמופיעים בתמונות ועוד.

פרטי דגם

נכס תיאור
קוד המודל models/gemini-pro-vision
את סוגי הנתונים הנתמכים

קלט

תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

12,288

מגבלת אסימוני פלט

4,096

מפרטים של תוכן אודיו/ויזואלי

אורך סרטון מקסימלי

2 דקות

מגבלות קצב[**] 60 בקשות בדקה
יכולות

הוראות מערכת

לא נתמך

מצב JSON

לא נתמך

סכימת JSON

לא נתמך

הגדרות בטיחות ניתנות להתאמה

נתמך

שמירה במטמון

לא נתמך

כוונון

לא נתמך

שליחת פונקציות

נתמך

הגדרות קריאה לפונקציות

לא נתמך

הפעלת קוד

לא נתמך

העדכון האחרון דצמבר 2023

הטמעה והטמעה של טקסט

הטמעת טקסט

אפשר להשתמש במודל 'הטמעת טקסט' כדי ליצור הטמעות טקסט בשביל של טקסט הקלט. למידע נוסף על המודל 'הטמעת טקסט', אפשר להיכנס אל מסמכי תיעוד של AI גנרטיבי ב-Vertex AI על הטמעות טקסט.

המודל 'הטמעת טקסט' עבר אופטימיזציה ליצירת הטמעות באמצעות 768. לטקסט של עד 2,048 אסימונים. הטמעת טקסט אלסטית גדולים פחות מ-768. אפשר להשתמש בהטמעות אלסטיות כדי ליצור מידות פלט קטנות יותר ועשויות לחסוך בעלויות מחשוב ואחסון עם פגיעה קלה בביצועים.

פרטי דגם
נכס תיאור
קוד המודל

Gemini API

models/text-embedding-004

Vertex AI

text-embedding-preview-0409

את סוגי הנתונים הנתמכים

קלט

טקסט

פלט

הטמעות טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

2,048

גודל מידות הפלט

768

מגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות ניתנות להתאמה לא נתמך
העדכון האחרון אפריל 2024

הטמעה

אפשר להשתמש במודל ההטמעה כדי ליצור הטמעות טקסט בשביל של טקסט הקלט.

מודל ההטמעה עבר אופטימיזציה ליצירת הטמעות עם 768 מימדים לטקסט של עד 2,048 אסימונים.

פרטי המודל מטמיעים
נכס תיאור
קוד המודל models/embedding-001
את סוגי הנתונים הנתמכים

קלט

טקסט

פלט

הטמעות טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

2,048

גודל מידות הפלט

768

מגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות ניתנות להתאמה לא נתמך
העדכון האחרון דצמבר 2023

בקרת איכות

אפשר להשתמש במודל AQA כדי לבצע מענה על שאלות משויכות (AQA) – משימות שקשורות למסמך, לקורפוס או לקבוצת מעברים. AQA מחזיר תשובות לשאלות שמבוססות על מקורות נתונים, וגם הערכה של ההסתברות שניתנת לתשובה.

פרטי דגם

נכס תיאור
קוד המודל models/aqa
את סוגי הנתונים הנתמכים

קלט

טקסט

פלט

טקסט

שפה נתמכת אנגלית
מגבלות אסימון[*]

מגבלת אסימוני קלט

7,168

מגבלת אסימוני פלט

1,024

מגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות ניתנות להתאמה נתמך
העדכון האחרון דצמבר 2023

כאן מפורטות דוגמאות ליכולות של המודלים האלה. שונות.

[*] אסימון מקביל לכ-4 תווים במודלים של Gemini. 100 אסימונים מורכבות מ-60-80 מילים באנגלית.

[**] הכנסה לאלף צפיות (RPM): בקשות לדקה
TPM: אסימונים לדקה
RPD: בקשות ביום
TPD: אסימונים ליום

עקב מגבלות הקיבולת, הגבלות הקצב של יצירת הבקשות המקסימליות שצוינו מובטחת.

דפוסי השמות של גרסת המודל

המודלים של Gemini זמינים בגרסה תצוגה מקדימה או בגרסה יציבה. ב אפשר להשתמש באחד מהפורמטים הבאים של שם מודל כדי לציין ואת הגרסה שבה אתם רוצים להשתמש.

  • העדכני ביותר: מצביע על הגרסה החדשנית של המודל גנרטיבית ושונות. המודל הבסיסי מתעדכן באופן קבוע, להיות גרסת תצוגה מקדימה. יש להשתמש רק באפליקציות ובסוגים של בדיקות אקסקלוסיביות להשתמש בכינוי הזה.

    כדי לציין את הגרסה העדכנית ביותר, צריך להשתמש בדפוס הבא: <model>-<generation>-<variation>-latest. לדוגמה, gemini-1.0-pro-latest.

  • היציבות האחרונה: מצביעה על הגרסה היציבה האחרונה שפורסמה של מודל טרנספורמר מסוים.

    כדי לציין את הגרסה היציבה האחרונה, משתמשים בתבנית הבאה: <model>-<generation>-<variation>. לדוגמה, gemini-1.0-pro.

  • יציב: מצביע על מודל יציב ספציפי. מודלים יציבים לא משתנים. לרוב האפליקציות בסביבת הייצור צריך להשתמש במודל יציב ספציפי.

    כדי לציין גרסה יציבה, משתמשים בדפוס הבא: <model>-<generation>-<variation>-<version>. לדוגמה, gemini-1.0-pro-001.

השפות הזמינות

המודלים של Gemini מאומנים לפעול בשפות הבאות:

  • ערבית (ar)
  • בנגלית (bn)
  • בולגרית (bg)
  • סינית (פשוטה ומסורתית) (zh)
  • קרואטית (hr)
  • צ'כית (cs)
  • דנית (da)
  • הולנדית (nl)
  • אנגלית (en)
  • אסטונית (et)
  • פינית (fi)
  • צרפתית (fr)
  • גרמנית (de)
  • יוונית (el)
  • עברית (iw)
  • הינדי (hi)
  • הונגרית (hu)
  • אינדונזית (id)
  • איטלקית (it)
  • יפנית (ja)
  • קוריאנית (ko)
  • לטבית (lv)
  • ליטאית (lt)
  • נורווגית (no)
  • פולנית (pl)
  • פורטוגזית (pt)
  • רומנית (ro)
  • רוסית (ru)
  • סרבית (sr)
  • סלובקית (sk)
  • סלובנית (sl)
  • ספרדית (es)
  • סווהילי (sw)
  • שוודית (sv)
  • תאית (th)
  • טורקית (tr)
  • אוקראינית (uk)
  • וייטנאמית (vi)