דוגמניות Gemini

וריאנטים של מודלים

ב-Gemini API יש מודלים שונים שעברו אופטימיזציה לתרחישים ספציפיים של שימוש. הנה סקירה כללית קצרה של הווריאנטים של Gemini שזמינים:

וריאנט של מודל קלט פלט אופטימיזציה עבור
Gemini 1.5 Flash
gemini-1.5-flash
אודיו, תמונות, סרטונים וטקסט טקסט ביצועים מהירים ורב-תכליתיים במגוון רחב של משימות
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
אודיו, תמונות, סרטונים וטקסט טקסט משימות בנפח גבוה וברמת אינטליגנציה נמוכה יותר
Gemini 1.5 Pro
gemini-1.5-pro
אודיו, תמונות, סרטונים וטקסט טקסט משימות מורכבות של חשיבה שמחייבות יותר אינטליגנציה
Gemini 1.0 Pro (הוצא משימוש ב-15 בפברואר 2025)
gemini-1.0-pro
טקסט טקסט משימות בשפה טבעית, שיחות טקסט וקוד עם זיכרון ויצירת קוד
הטמעת טקסט
text-embedding-004
טקסט הטמעת טקסט מדידת הקשר בין מחרוזות טקסט
AQA
aqa
טקסט טקסט מתן תשובות לשאלות שמבוססות על מקורות

Gemini 1.5 Flash

Gemini 1.5 Flash הוא מודל מהיר ומגוון עם תמיכה במגוון מודלים, שמאפשר להתאים את עצמו למשימות מגוונות.

לניסיון ב-AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-1.5-flash
סוגי הנתונים הנתמכים

נתונים

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

1,048,576

מגבלה על אסימוני פלט

8,192

מפרטים של אודיו/וידאו

מספר התמונות המקסימלי לכל הנחיה

3,600

אורך הסרטון המקסימלי

שעה אחת

אורך האודיו המקסימלי

כ-9.5 שעות

הגבלות קצב[**]
בחינם:
  • 15 סיבובים לדקה
  • 1 מיליון TPM
  • 1,500 RPD
Pay-as-you-go:
  • 2,000 סל״ד
  • 4 מיליון TPM
יכולות של

הוראות למערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות שניתן לשנות

נתמך

אחסון במטמון

נתמך

כוונון

נתמך

קריאה לפונקציה

נתמך

ביצוע קוד

נתמך

Versions
למידע נוסף, אפשר לקרוא את המאמר בנושא תבניות של גרסאות מודלים.
  • החדש ביותר: gemini-1.5-flash-latest
  • הגרסה היציבה האחרונה: gemini-1.5-flash
  • יציב:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
העדכון האחרון ספטמבר 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B הוא מודל קטן שמיועד למשימות עם רמת אינטליגנציה נמוכה יותר.

לניסיון ב-AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-1.5-flash-8b
סוגי הנתונים הנתמכים

נתונים

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

1,048,576

מגבלה על אסימוני פלט

8,192

מפרטים של אודיו/וידאו

מספר התמונות המקסימלי לכל הנחיה

3,600

אורך הסרטון המקסימלי

שעה אחת

אורך האודיו המקסימלי

כ-9.5 שעות

הגבלות קצב[**]
בחינם:
  • 15 סיבובים לדקה
  • 1 מיליון TPM
  • 1,500 RPD
Pay-as-you-go:
  • 4,000 סל״ד
  • 4 מיליון TPM
יכולות של

הוראות למערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות שניתן לשנות

נתמך

אחסון במטמון

נתמך

כוונון

נתמך

קריאה לפונקציה

נתמך

ביצוע קוד

נתמך

Versions
למידע נוסף, קראו את המאמר בנושא תבניות של גרסאות מודלים.
  • החדש ביותר: gemini-1.5-flash-8b-latest
  • הגרסה היציבה האחרונה: gemini-1.5-flash-8b
  • יציב:
    • gemini-1.5-flash-8b-001
העדכון האחרון אוקטובר 2024

Gemini 1.5 Pro

Gemini 1.5 Pro הוא מודל רב-מודלי בגודל בינוני שעובר אופטימיזציה למגוון רחב של משימות לוגיות. 1.5 Pro יכול לעבד כמויות גדולות של נתונים בו-זמנית, כולל שעתיים של וידאו, 19 שעות של אודיו, בסיסים של קוד עם 60,000 שורות קוד או 2,000 דפי טקסט.

לניסיון ב-AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-1.5-pro
סוגי הנתונים הנתמכים

נתונים

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

2,097,152

מגבלה על אסימוני פלט

8,192

מפרטים של אודיו/וידאו

מספר התמונות המקסימלי לכל הנחיה

7,200

אורך הסרטון המקסימלי

שעתיים

אורך האודיו המקסימלי

כ-19 שעות

הגבלות קצב[**]
בחינם:
  • 2 RPM
  • 32,000 TPM
  • 50 RPD
Pay-as-you-go:
  • 1,000 סל״ד
  • 4 מיליון TPM
יכולות של

הוראות למערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות שניתן לשנות

נתמך

אחסון במטמון

נתמך

כוונון

לא נתמך

קריאה לפונקציה

נתמך

ביצוע קוד

נתמך

Versions
למידע נוסף, אפשר לקרוא את המאמר בנושא תבניות של גרסאות מודלים.
  • החדש ביותר: gemini-1.5-pro-latest
  • הגרסה היציבה האחרונה: gemini-1.5-pro
  • יציב:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
העדכון האחרון ספטמבר 2024

Gemini 1.0 Pro (הווצא משימוש)

Gemini 1.0 Pro הוא מודל NLP שמטפל במשימות כמו שיחות טקסט וקוד בכמה סבבים ויצירת קוד.

לניסיון ב-AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-1.0-pro
סוגי הנתונים הנתמכים

קלט

טקסט

פלט

טקסט

הגבלות קצב[**]
בחינם:
  • 15 סיבובים לדקה
  • 32,000 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 360 סל״ד
  • 120,000 TPM
  • 30,000 RPD
יכולות של

הוראות למערכת

לא נתמך

מצב JSON

לא נתמך

סכימת JSON

לא נתמך

הגדרות בטיחות שניתן לשנות

נתמך

אחסון במטמון

לא נתמך

כוונון

נתמך

קריאה לפונקציה

נתמך

הגדרת קריאה לפונקציה

לא נתמך

ביצוע קוד

לא נתמך

Versions
  • החדש ביותר: gemini-1.0-pro-latest
  • הגרסה היציבה האחרונה: gemini-1.0-pro
  • יציבה: gemini-1.0-pro-001
העדכון האחרון פברואר 2024

הטמעת טקסט והטמעה

הטמעת טקסט

הטמעות טקסט משמשות למדידת הקשר בין מחרוזות, והן נמצאות בשימוש נרחב באפליקציות רבות של AI.

text-embedding-004 משיג ביצועי אחזור טובים יותר ומנצח מודלים קיימים עם מאפיינים דומים, במבחני ההטמעה הרגילים של MTEB.

פרטי דגם
נכס תיאור
קוד הדגם

Gemini API

models/text-embedding-004

סוגי הנתונים הנתמכים

קלט

טקסט

פלט

הטמעת טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

2,048

גודל המאפיין בפלט

768

הגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות שניתן לשנות לא נתמך
העדכון האחרון אפריל 2024

הטמעה

אפשר להשתמש במודל הטמעת הטקסט כדי ליצור טקסטים מוטמעים לטקסט הקלט.

מודל הטמעת הטקסט עבר אופטימיזציה ליצירת הטמעות עם 768 מאפיינים לטקסט של עד 2,048 אסימונים.

הטמעת פרטי המודל
נכס תיאור
קוד הדגם models/embedding-001
סוגי הנתונים הנתמכים

קלט

טקסט

פלט

הטמעת טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

2,048

גודל המאפיין בפלט

768

הגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות שניתן לשנות לא נתמך
העדכון האחרון דצמבר 2023

AQA

אפשר להשתמש במודל AQA כדי לבצע משימות שקשורות למענה על שאלות עם שיוך לפרטים (AQA) במסמך, בקורpus או בקבוצת קטעים. המודל של AQA מחזיר תשובות לשאלות שמבוססות על מקורות שסופקו, יחד עם הערכה של הסבירות לקבלת תשובה.

פרטי דגם

נכס תיאור
קוד הדגם models/aqa
סוגי הנתונים הנתמכים

קלט

טקסט

פלט

טקסט

שפה נתמכת אנגלית
מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

7,168

מגבלה על אסימוני פלט

1,024

הגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות שניתן לשנות נתמך
העדכון האחרון דצמבר 2023

בדוגמאות תוכלו לראות את היכולות של הווריאציות האלה של המודלים.

[*] אסימון שווה לכ-4 תווים במודלים של Gemini. 100 אסימונים הם כ-60 עד 80 מילים באנגלית.

[**] RPM: בקשות לדקה
TPM: טוקנים לדקה
RPD: בקשות ליום
TPD: טוקנים ליום

עקב מגבלות קיבולת, לא מובטחות המגבלות המקסימליות שצוינו לשיעור שליחה.

דפוסים של שמות של גרסאות של מודלים

מודלים של Gemini זמינים בגרסת טרום-השקה או בגרסת יציבה. בקוד, אפשר להשתמש באחד מהפורמטים הבאים של שם הדגם כדי לציין את הדגם והגרסה שבהם רוצים להשתמש.

  • Latest: מפנה לגרסה העדכנית ביותר של המודל לדור ולוריאנט מסוימים. המודל הבסיסי מתעדכן באופן קבוע, ויכול להיות שהוא בגרסה טרום-השקה. מומלץ להשתמש בכתובת החלופית הזו רק באפליקציות ובאב טיפוס לבדיקה exploratorie.

    כדי לציין את הגרסה העדכנית ביותר, משתמשים בתבנית הבאה: <model>-<generation>-<variation>-latest. לדוגמה, gemini-1.0-pro-latest.

  • הגרסה היציבה האחרונה: מפנה לגרסה היציבה האחרונה שפורסמה לדור ולגרסה של המודל שצוינו.

    כדי לציין את הגרסה היציבה האחרונה, צריך להשתמש בתבנית הבאה: <model>-<generation>-<variation>. לדוגמה, gemini-1.0-pro.

  • יציב: מפנה למודל יציב ספציפי. מודלים יציבים לא משתנים. ברוב האפליקציות בסביבת הייצור צריך להשתמש בדגם יציב ספציפי.

    כדי לציין גרסה יציבה, משתמשים בתבנית הבאה: <model>-<generation>-<variation>-<version>. לדוגמה, gemini-1.0-pro-001.

  • ניסיוני: מציין מודל ניסיוני שזמין בתצוגה המקדימה, כפי שמוגדר בתנאים, כלומר הוא לא מיועד לשימוש בסביבת הייצור. אנחנו משיקים מודלים ניסיוניים כדי לקבל משוב, כדי להעביר במהירות את העדכונים האחרונים למפתחים וכדי להדגיש את קצב החדשנות ב-Google. מה שאנחנו לומדים מההשקות הניסיוניות עוזר לנו להחליט איך להשיק את המודלים באופן נרחב יותר. אפשר להחליף מודל ניסיוני במודל אחר ללא הודעה מוקדמת. אנחנו לא מתחייבים שמודל ניסיוני יהפוך למודל יציב בעתיד.

    כדי לציין גרסה ניסיונית, משתמשים בתבנית הבאה: <model>-<generation>-<variation>-<version>. לדוגמה, gemini-exp-1121.

השפות הזמינות

מודלים של Gemini מאומנים לעבוד עם השפות הבאות:

  • ערבית (ar)
  • בנגלית (bn)
  • בולגרית (bg)
  • סינית פשוטה ומסורתית (zh)
  • קרואטית (hr)
  • צ'כית (cs)
  • דנית (da)
  • הולנדית (nl)
  • אנגלית (en)
  • אסטונית (et)
  • פינית (fi)
  • צרפתית (fr)
  • גרמנית (de)
  • יוונית (el)
  • עברית (iw)
  • הינדי (hi)
  • הונגרית (hu)
  • אינדונזית (id)
  • איטלקית (it)
  • יפנית (ja)
  • קוריאנית (ko)
  • לטבית (lv)
  • ליטאית (lt)
  • נורווגית (no)
  • פולנית (pl)
  • פורטוגזית (pt)
  • רומנית (ro)
  • רוסית (ru)
  • סרבית (sr)
  • סלובקית (sk)
  • סלובנית (sl)
  • ספרדית (es)
  • סווהילי (sw)
  • שוודית (sv)
  • תאילנדית (th)
  • טורקית (tr)
  • אוקראינית (uk)
  • וייטנאמית (vi)