דוגמניות Gemini

וריאציות של דגם

ב-Gemini API יש מודלים שונים שמותאמים לשימוש ספציפי במקרים שונים. סקירה כללית קצרה של הווריאציות הזמינות של Gemini:

גרסת הדגם קלט(קלט) פלט אופטימיזציה עבור
Gemini 1.5 Flash
gemini-1.5-flash
אודיו, תמונות, סרטונים וטקסט טקסט ביצועים מהירים ומגוונים במגוון משימות
Gemini 1.5 Pro
gemini-1.5-pro
אודיו, תמונות, סרטונים וטקסט טקסט משימות מורכבות של הסקת מסקנות, כמו יצירת קוד וטקסט, עריכת טקסט, פתרון בעיות, חילוץ נתונים ויצירה שלהם
Gemini 1.0 Pro
gemini-1.0-pro
טקסט טקסט משימות בשפה טבעית, צ'אט עם קוד וצ'אט במספר תורות וקוד ליצירת תמונות,
הטמעת טקסט
text-embedding-004
טקסט הטמעות טקסט מדידת החיבור בין מחרוזות טקסט
AQA
aqa
טקסט טקסט מתן תשובות לשאלות מבוססות-מקור

בטבלה הבאה מפורטים המאפיינים של המודלים של Gemini שמשותף לכל הווריאציות של המודל:

מאפיין תיאור
נתוני אימון המועד האחרון למימוש הידע של Gemini הוא נובמבר 2023. הידע על אירועים לאחר מועד זה מוגבל.
שפות נתמכות להצגת השפות הזמינות
פרמטרים של מודל שניתן להגדיר
  • המיקום העליון
  • K מובילים
  • טמפרטורה
  • הפסקת הרצף
  • אורך פלט מקסימלי
  • מספר התשובות האפשריות

לעיון בפרמטרים של המודל של גנרטיביים יכולים לספק מידע על כל אחד מהפרמטרים האלה.

פלאש Gemini 1.5

Gemini 1.5 Flash הוא מודל רב-אופני מהיר ורב-תכליתי שמאפשר לבצע התאמה לעומס (scaling) למשימות מגוונות.

להתנסות ב-AI Studio

פרטי דגם

נכס תיאור
קוד המודל models/gemini-1.5-flash
את סוגי הנתונים הנתמכים

קלט

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

1,048,576

מגבלת אסימוני פלט

8,192

מפרטים של תוכן אודיו/ויזואלי

מספר תמונות מקסימלי לכל הנחיה

3,600

אורך סרטון מקסימלי

שעה אחת

אורך מקסימלי של אודיו

כ-9.5 שעות

מגבלות קצב[**]
בחינם:
  • 15 סל״ד
  • מיליון מודולי פלטפורמה מהימנים (TPM)
  • 1,500 RPD
Pay-as-you-go:
  • 1,000 סל״ד
  • 4 מיליון מודולי פלטפורמה מהימנים (TPM)
Capabilities

הוראות מערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות ניתנות להתאמה

נתמך

שמירה במטמון

נתמך

כוונון

נתמך

שליחת פונקציות

נתמך

הגדרות קריאה לפונקציות

נתמך

הפעלת קוד

נתמך

גרסאות
  • החדש ביותר: gemini-1.5-flash-latest
  • היציבות האחרונה: gemini-1.5-flash
  • יציב: gemini-1.5-flash-001
  • ניסיוני:
    • gemini-1.5-flash-exp-0827
    • gemini-1.5-flash-8b-exp-0827
העדכון האחרון מאי 2024

Gemini 1.5 Pro

Gemini 1.5 Pro הוא מודל רב-אופני בינוני שמותאם במיוחד מגוון רחב של משימות של הסקת מסקנות. 1.5 Pro יכול לעבד כמויות גדולות של נתונים בו-זמנית, כולל שעתיים של וידאו, 19 שעות של אודיו, קודי בסיס עם 60,000 שורות קוד או 2,000 דפים של טקסט.

להתנסות ב-AI Studio

פרטי דגם

נכס תיאור
קוד המודל models/gemini-1.5-pro
את סוגי הנתונים הנתמכים

קלט

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

2,097,152

מגבלת אסימוני פלט

8,192

מפרטים של תוכן אודיו/ויזואלי

מספר תמונות מקסימלי לכל הנחיה

7,200

אורך סרטון מקסימלי

שעתיים

אורך מקסימלי של אודיו

בערך 19 שעות

מגבלות קצב[**]
בחינם:
  • 2 סיבובים לדקה
  • 32,000 TPM
  • RPD 50
Pay-as-you-go:
  • 360 סל״ד
  • 4 מיליון מודולי פלטפורמה מהימנים (TPM)
Capabilities

הוראות מערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות ניתנות להתאמה

נתמך

שמירה במטמון

נתמך

כוונון

לא נתמך

שליחת פונקציות

נתמך

הגדרות קריאה לפונקציות

נתמך

הפעלת קוד

נתמך

גרסאות
  • החדש ביותר: gemini-1.5-pro-latest
  • היציבות האחרונה: gemini-1.5-pro
  • יציב: gemini-1.5-pro-001
  • ניסיוני:
    • gemini-1.5-pro-exp-0801
    • gemini-1.5-pro-exp-0827
העדכון האחרון מאי 2024

Gemini 1.0 Pro

Gemini 1.0 Pro הוא מודל NLP לטיפול במשימות כמו ניסוח טקסט מרובה פניות צ'אט בקוד ויצירת קוד.

להתנסות ב-AI Studio

פרטי דגם

נכס תיאור
קוד המודל models/gemini-1.0-pro
את סוגי הנתונים הנתמכים

קלט

טקסט

פלט

טקסט

מגבלות קצב[**]
בחינם:
  • 15 סל״ד
  • 32,000 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 360 סל״ד
  • 120,000 TPM
  • 30,000 RPD
Capabilities

הוראות מערכת

לא נתמך

מצב JSON

לא נתמך

סכימת JSON

לא נתמך

הגדרות בטיחות ניתנות להתאמה

נתמך

שמירה במטמון

לא נתמך

כוונון

נתמך

שליחת פונקציות

נתמך

הגדרות קריאה לפונקציות

לא נתמך

הפעלת קוד

לא נתמך

גרסאות
  • החדש ביותר: gemini-1.0-pro-latest
  • היציבות האחרונה: gemini-1.0-pro
  • יציב: gemini-1.0-pro-001
העדכון האחרון פברואר 2024

הטמעה והטמעה של טקסט

הטמעת טקסט

הטמעות טקסט משמשות למדידת הקשר של מחרוזות, והן נמצאות בשימוש נרחב של בינה מלאכותית גנרטיבית.

text-embedding-004 משיגה ביצועי אחזור טובים יותר וביצועים טובים יותר ממודלים קיימים עם מאפיינים דומים ביחס לבנצ'מרקים הרגילים של הטמעת MTEB.

פרטי דגם
נכס תיאור
קוד המודל

Gemini API

models/text-embedding-004

את סוגי הנתונים הנתמכים

קלט

טקסט

פלט

הטמעות טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

2,048

גודל מידות הפלט

768

מגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות ניתנות להתאמה לא נתמך
העדכון האחרון אפריל 2024

הטמעה

אפשר להשתמש במודל ההטמעה כדי ליצור הטמעות טקסט בשביל של טקסט הקלט.

מודל ההטמעה עבר אופטימיזציה ליצירת הטמעות עם 768 מימדים לטקסט של עד 2,048 אסימונים.

פרטי המודל מטמיעים
נכס תיאור
קוד המודל models/embedding-001
את סוגי הנתונים הנתמכים

קלט

טקסט

פלט

הטמעות טקסט

מגבלות אסימון[*]

מגבלת אסימוני קלט

2,048

גודל מידות הפלט

768

מגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות ניתנות להתאמה לא נתמך
העדכון האחרון דצמבר 2023

AQA

אפשר להשתמש במודל AQA כדי לבצע מענה על שאלות משויכות (AQA) – משימות שקשורות למסמך, לקורפוס או לקבוצת מעברים. AQA מחזיר תשובות לשאלות שמבוססות על מקורות נתונים, וגם הערכה של ההסתברות שניתנת לתשובה.

פרטי דגם

נכס תיאור
קוד המודל models/aqa
את סוגי הנתונים הנתמכים

קלט

טקסט

פלט

טקסט

שפה נתמכת אנגלית
מגבלות אסימון[*]

מגבלת אסימוני קלט

7,168

מגבלת אסימוני פלט

1,024

מגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות ניתנות להתאמה נתמך
העדכון האחרון דצמבר 2023

כאן מפורטות דוגמאות ליכולות של המודלים האלה. שונות.

[*] אסימון מקביל לכ-4 תווים במודלים של Gemini. 100 אסימונים מורכבות מ-60-80 מילים באנגלית.

[**] הכנסה לאלף צפיות (RPM): בקשות לדקה
TPM: אסימונים לדקה
RPD: בקשות ביום
TPD: אסימונים ליום

עקב מגבלות הקיבולת, הגבלות הקצב של יצירת הבקשות המקסימליות שצוינו מובטחת.

דפוסי השמות של גרסת המודל

המודלים של Gemini זמינים בגרסה תצוגה מקדימה או בגרסה יציבה. ב אפשר להשתמש באחד מהפורמטים הבאים של שם מודל כדי לציין ואת הגרסה שבה אתם רוצים להשתמש.

  • העדכני ביותר: מצביע על הגרסה החדשנית של המודל גנרטיבית ושונות. המודל הבסיסי מתעדכן באופן קבוע, להיות גרסת תצוגה מקדימה. יש להשתמש רק באפליקציות ובסוגים של בדיקות אקסקלוסיביות להשתמש בכינוי הזה.

    כדי לציין את הגרסה העדכנית ביותר, צריך להשתמש בדפוס הבא: <model>-<generation>-<variation>-latest לדוגמה, gemini-1.0-pro-latest.

  • היציבות האחרונה: מצביעה על הגרסה היציבה האחרונה שפורסמה של מודל טרנספורמר מסוים.

    כדי לציין את הגרסה היציבה האחרונה, משתמשים בתבנית הבאה: <model>-<generation>-<variation> לדוגמה, gemini-1.0-pro.

  • יציב: מצביע על מודל יציב ספציפי. מודלים יציבים לא משתנים. לרוב האפליקציות בסביבת הייצור צריך להשתמש במודל יציב ספציפי.

    כדי לציין גרסה יציבה, משתמשים בדפוס הבא: <model>-<generation>-<variation>-<version> לדוגמה, gemini-1.0-pro-001.

  • ניסיוני: מצביע על מודל ניסיוני שזמין בתצוגה מקדימה, כפי שמוגדר בתנאים, כלומר, היא לא מיועדת לשימוש בסביבת ייצור. אנחנו משיקים מודלים ניסיוניים כדי לאסוף משוב, להעביר את העדכונים האחרונים שלנו לידי המפתחים במהירות, ולהדגיש את קצב החדשנות שמתרחשת ב-Google. מה אנחנו לומדים מהשקות ניסיוניות, כדי להבין איך אנחנו מפרסמים מודלים יותר במידה רבה. ניתן להחליף מודל ניסיוני במודל אחר ללא ציון קודם הודעה מראש. אנחנו לא מבטיחים שמודל ניסיוני יהפוך מודל יציב בעתיד.

    כדי לציין גרסה ניסיונית, צריך להשתמש בדפוס הבא: <model>-<generation>-<variation>-<version> לדוגמה, gemini-1.5-pro-exp-0801.

השפות הזמינות

המודלים של Gemini מאומנים לפעול בשפות הבאות:

  • ערבית (ar)
  • בנגלית (bn)
  • בולגרית (bg)
  • סינית (פשוטה ומסורתית) (zh)
  • קרואטית (hr)
  • צ'כית (cs)
  • דנית (da)
  • הולנדית (nl)
  • אנגלית (en)
  • אסטונית (et)
  • פינית (fi)
  • צרפתית (fr)
  • גרמנית (de)
  • יוונית (el)
  • עברית (iw)
  • הינדי (hi)
  • הונגרית (hu)
  • אינדונזית (id)
  • איטלקית (it)
  • יפנית (ja)
  • קוריאנית (ko)
  • לטבית (lv)
  • ליטאית (lt)
  • נורווגית (no)
  • פולנית (pl)
  • פורטוגזית (pt)
  • רומנית (ro)
  • רוסית (ru)
  • סרבית (sr)
  • סלובקית (sk)
  • סלובנית (sl)
  • ספרדית (es)
  • סווהילי (sw)
  • שוודית (sv)
  • תאית (th)
  • טורקית (tr)
  • אוקראינית (uk)
  • וייטנאמית (vi)