Gemini

וריאציות של דגם

ב-Gemini API יש מודלים שונים שמותאמים לתרחישי שימוש ספציפיים. סקירה כללית קצרה של הווריאציות הזמינות של Gemini:

גרסת הדגם קלט(קלט) פלט אופטימיזציה עבור
Gemini 1.5 Pro
gemini-1.5-pro
אודיו, תמונות, סרטונים וטקסט טקסט משימות מורכבות של הסקת מסקנות, כמו יצירת קוד וטקסט, עריכת טקסט, פתרון בעיות, חילוץ נתונים ויצירה של נתונים
Gemini 1.5 Flash
gemini-1.5-flash
אודיו, תמונות, סרטונים וטקסט טקסט ביצועים מהירים ומגוונים במגוון משימות
Gemini 1.0 Pro
gemini-1.0-pro
טקסט טקסט משימות בשפה טבעית, צ'אט עם קוד וטקסט מרובה פניות ויצירת קודים
(הוצאה משימוש) Gemini 1.0 Pro Vision
gemini-pro-vision
תמונות, סרטונים וטקסט טקסט משימות חזותיות, כמו יצירת תיאורי תמונות או זיהוי אובייקטים בתמונות
הטמעת טקסט
text-embedding-004
טקסט הטמעות טקסט מדידת החיבור בין מחרוזות טקסט
AQA
aqa
טקסט טקסט מתן תשובות לשאלות מבוססות-מקור

בטבלה הבאה מפורטים המאפיינים של המודלים של Gemini שמשותפים לכל הווריאציות של המודלים:

מאפיין תיאור
נתוני אימון המועד האחרון למימוש הידע של Gemini הוא נובמבר 2023. הידע על אירועים לאחר מועד זה מוגבל.
שפות נתמכות להצגת השפות הזמינות
פרמטרים של מודל שניתן להגדיר
  • המיקום העליון
  • K מובילים
  • טמפרטורה
  • הפסקת הרצף
  • אורך פלט מקסימלי
  • מספר התשובות האפשריות

מידע על כל אחד מהפרמטרים האלה מופיע במדריך בנושא מודלים גנרטיביים בקטע בנושא פרמטרים של מודלים.

פלאש Gemini 1.5

Gemini 1.5 Flash הוא מודל רב-אופני מהיר ורב-תכליתי שמאפשר לבצע התאמה לעומס (scaling) בין משימות מגוונות.

להתנסות ב-AI Studio

פרטי דגם

מאפיין (property) תיאור
קוד המודל models/gemini-1.5-flash
את סוגי הנתונים הנתמכים

קלט

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

1,048,576

מגבלת אסימוני פלט

8,192

מפרטים של תוכן אודיו/ויזואלי

מספר תמונות מקסימלי לכל הנחיה

3,600

אורך סרטון מקסימלי

שעה אחת

אורך מקסימלי של אודיו

כ-9.5 שעות

מגבלות קצב[**]
בחינם:
  • 15 סל״ד
  • מיליון מודולי פלטפורמה מהימנים (TPM)
  • 1,500 RPD
Pay-as-you-go:
  • 1,000 סל״ד
  • 2 מיליון מודולי פלטפורמה מהימנים (TPM)
יכולות

הוראות מערכת

נתמך

מצב JSON

נתמך

סכימת JSON

לא נתמך

הגדרות בטיחות ניתנות להתאמה

נתמך

שמירה במטמון

נתמך

כוונון

לא נתמך

שליחת פונקציות

נתמך

הגדרות קריאה לפונקציות

נתמך

הפעלת קוד

נתמך

העדכון האחרון מאי 2024

Gemini 1.5 Pro

Gemini 1.5 Pro הוא מודל מרובה מצבים בגודל בינוני שמותאם למגוון רחב של משימות של הסקת מסקנות. 1.5 Pro יכול לעבד כמויות גדולות של נתונים בו-זמנית, כולל שעתיים של וידאו, 19 שעות של אודיו, רכיבי קוד עם 60,000 שורות קוד או 2,000 עמודים של טקסט.

להתנסות ב-AI Studio

פרטי דגם

מאפיין (property) תיאור
קוד המודל models/gemini-1.5-pro
את סוגי הנתונים הנתמכים

קלט

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

2,097,152

מגבלת אסימוני פלט

8,192

מפרטים של תוכן אודיו/ויזואלי

מספר תמונות מקסימלי לכל הנחיה

7,200

אורך סרטון מקסימלי

שעתיים

אורך מקסימלי של אודיו

בערך 19 שעות

מגבלות קצב[**]
בחינם:
  • 2 סל״ד
  • 32,000 TPM
  • RPD 50
Pay-as-you-go:
  • 360 סל״ד
  • 2 מיליון מודולי פלטפורמה מהימנים (TPM)
  • 10,000 RPD
יכולות

הוראות מערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות ניתנות להתאמה

נתמך

שמירה במטמון

נתמך

כוונון

לא נתמך

שליחת פונקציות

נתמך

הגדרות קריאה לפונקציות

נתמך

הפעלת קוד

נתמך

העדכון האחרון מאי 2024

Gemini 1.0 Pro

Gemini 1.0 Pro הוא מודל NLP לטיפול במשימות כמו יצירת קוד ושליחת טקסט בצ'אט עם מספר פניות.

להתנסות ב-AI Studio

פרטי דגם

מאפיין (property) תיאור
קוד המודל models/gemini-1.0-pro
את סוגי הנתונים הנתמכים

קלט

טקסט

פלט

טקסט

מגבלות קצב[**]
בחינם:
  • 15 סל״ד
  • 32,000 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 360 סל״ד
  • 120,000 TPM
  • 30,000 RPD
יכולות

הוראות מערכת

לא נתמך

מצב JSON

לא נתמך

סכימת JSON

לא נתמך

הגדרות בטיחות ניתנות להתאמה

נתמך

שמירה במטמון

לא נתמך

כוונון

נתמך

שליחת פונקציות

נתמך

הגדרות קריאה לפונקציות

לא נתמך

הפעלת קוד

לא נתמך

העדכון האחרון פברואר 2024

(הוצאה משימוש) Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision הוא מודל רב-אופני שעבר אופטימיזציה לביצועים, ויכול לבצע משימות שקשורות ויזואלית. לדוגמה, 1.0 Pro Vision יכול ליצור תיאורי תמונות, לזהות אובייקטים שמופיעים בתמונות, לספק מידע על מקומות או אובייקטים שמופיעים בתמונות ועוד.

פרטי דגם

מאפיין (property) תיאור
קוד המודל models/gemini-pro-vision
את סוגי הנתונים הנתמכים

קלט

תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

12,288

מגבלת אסימוני פלט

4,096

מפרטים של תוכן אודיו/ויזואלי

אורך סרטון מקסימלי

שתי דקות

מגבלות קצב[**] 60 בקשות בדקה
יכולות

הוראות מערכת

לא נתמך

מצב JSON

לא נתמך

סכימת JSON

לא נתמך

הגדרות בטיחות ניתנות להתאמה

נתמך

שמירה במטמון

לא נתמך

כוונון

לא נתמך

שליחת פונקציות

נתמך

הגדרות קריאה לפונקציות

לא נתמך

הפעלת קוד

לא נתמך

העדכון האחרון דצמבר 2023

הטמעה והטמעה של טקסט

הטמעת טקסט

אפשר להשתמש במודל 'הטמעת טקסט' כדי ליצור הטמעות טקסט לטקסט שהוזן. מידע נוסף על המודל 'הטמעת טקסט' זמין במסמכי התיעוד של AI גנרטיבי ב-Vertex AI.

המודל 'הטמעת טקסט' עבר אופטימיזציה ליצירת הטמעות עם 768 מידות לטקסט של עד 2,048 אסימונים. הטמעת טקסט מאפשרת הטמעה אלסטית בגדלים של עד 768. אפשר להשתמש בהטמעות אלסטיות כדי ליצור מידות פלט קטנות יותר ואולי לחסוך בעלויות מחשוב ואחסון עם הפסד קל של ביצועים.

פרטי דגם
מאפיין (property) תיאור
קוד המודל

Gemini API

models/text-embedding-004

Vertex AI

text-embedding-preview-0409

את סוגי הנתונים הנתמכים

קלט

טקסט

פלט

הטמעות טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

2,048

גודל מידות הפלט

768

מגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות ניתנות להתאמה לא נתמך
העדכון האחרון אפריל 2024

הטמעה

אפשר להשתמש במודל ההטמעה כדי ליצור הטמעות טקסט לטקסט שהוזן.

מודל ההטמעה עבר אופטימיזציה ליצירת הטמעות עם 768 מימדים לטקסט של עד 2,048 אסימונים.

פרטי המודל מטמיעים
מאפיין (property) תיאור
קוד המודל models/embedding-001
את סוגי הנתונים הנתמכים

קלט

טקסט

פלט

הטמעות טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

2,048

גודל מידות הפלט

768

מגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות ניתנות להתאמה לא נתמך
העדכון האחרון דצמבר 2023

בקרת איכות

אפשר להשתמש במודל AQA כדי לבצע משימות שקשורות לתשובות לשאלות משויכות (AQA) במסמך, בקורפוס או בקבוצה של מעברים. מודל AQA מחזיר תשובות לשאלות שמתבססות על מקורות נתונים, וגם הערכה של ההסתברות שניתנת לתשובה.

פרטי דגם

מאפיין (property) תיאור
קוד המודל models/aqa
את סוגי הנתונים הנתמכים

קלט

טקסט

פלט

טקסט

שפה נתמכת אנגלית
מגבלות אסימון[*]

מגבלת אסימוני קלט

7,168

מגבלת אסימוני פלט

1,024

מגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות ניתנות להתאמה נתמך
העדכון האחרון דצמבר 2023

תוכלו להיעזר בדוגמאות כדי ללמוד על היכולות של הווריאציות האלה של המודל.

[*] אסימון מקביל לכ-4 תווים במודלים של Gemini. 100 אסימונים מכילים בערך 60-80 מילים באנגלית.

[**] RPM: בקשות לדקה
TPM: אסימונים לדקה
RPD: בקשות ליום
TPD: אסימונים ליום

בגלל מגבלות הקיבולת, לא מובטחות הגבלת קצב מקסימלית.

דפוסי השמות של גרסת המודל

המודלים של Gemini זמינים בגרסה תצוגה מקדימה או בגרסה יציבה. בקוד שלכם תוכלו להשתמש באחד מהפורמטים הבאים של שם המודל, כדי לציין באיזה דגם וגרסה אתם רוצים להשתמש.

  • העדכניות ביותר: מצביעה על הגרסה החדשנית של המודל ביחס לגנרציה ולגרסה מסוימת. המודל הבסיסי מתעדכן באופן קבוע, ויכול להיות שהוא גרסת תצוגה מקדימה. אפשר להשתמש בכתובת האימייל הזו רק באפליקציות של כלי הבדיקה ובגרסאות אב טיפוס של בדיקות.

    כדי לציין את הגרסה העדכנית ביותר, משתמשים בדפוס הבא: <model>-<generation>-<variation>-latest. לדוגמה, gemini-1.0-pro-latest.

  • היציבות האחרונה: מצביעה על הגרסה היציבה האחרונה שנוצרה בשביל הגרסה והגנרציה של המודל שצוינו.

    כדי לציין את הגרסה היציבה האחרונה משתמשים בתבנית הבאה: <model>-<generation>-<variation>. לדוגמה: gemini-1.0-pro.

  • יציב: מצביע על מודל יציב ספציפי. מודלים יציבים לא משתנים. לרוב האפליקציות בסביבת הייצור צריך להשתמש במודל יציב ספציפי.

    כדי לציין גרסה יציבה משתמשים בדפוס הבא: <model>-<generation>-<variation>-<version>. לדוגמה, gemini-1.0-pro-001.

השפות הזמינות

המודלים של Gemini מאומנים לפעול בשפות הבאות:

  • ערבית (ar)
  • בנגלית (bn)
  • בולגרית (bg)
  • סינית (פשוטה ומסורתית) (zh)
  • קרואטית (hr)
  • צ'כית (cs)
  • דנית (da)
  • הולנדית (nl)
  • אנגלית (en)
  • אסטונית (et)
  • פינית (fi)
  • צרפתית (fr)
  • גרמנית (de)
  • יוונית (el)
  • עברית (iw)
  • הינדי (hi)
  • הונגרית (hu)
  • אינדונזית (id)
  • איטלקית (it)
  • יפנית (ja)
  • קוריאנית (ko)
  • לטבית (lv)
  • ליטאית (lt)
  • נורווגית (no)
  • פולנית (pl)
  • פורטוגזית (pt)
  • רומנית (ro)
  • רוסית (ru)
  • סרבית (sr)
  • סלובקית (sk)
  • סלובנית (sl)
  • ספרדית (es)
  • סווהילי (sw)
  • שוודית (sv)
  • תאית (th)
  • טורקית (tr)
  • אוקראינית (uk)
  • וייטנאמית (vi)