דוגמניות Gemini

וריאנטים של מודלים

ב-Gemini API יש מודלים שונים שעברו אופטימיזציה לתרחישים ספציפיים של שימוש. לפניכם סקירה כללית קצרה של הווריאנטים של Gemini שזמינים:

וריאנט של מודל קלט פלט אופטימיזציה עבור
Gemini 2.0 Flash
gemini-2.0-flash-exp
אודיו, תמונות, סרטונים וטקסט טקסט, תמונות (בקרוב) ואודיו (בקרוב) תכונות, מהירות ויצירה של מודלים במגוון מודלים מהדור הבא למגוון רחב של משימות
Gemini 1.5 Flash
gemini-1.5-flash
אודיו, תמונות, סרטונים וטקסט טקסט ביצועים מהירים ורב-תכליתיים במגוון רחב של משימות
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
אודיו, תמונות, סרטונים וטקסט טקסט משימות בנפח גבוה וברמת אינטליגנציה נמוכה יותר
Gemini 1.5 Pro
gemini-1.5-pro
אודיו, תמונות, סרטונים וטקסט טקסט משימות מורכבות של חשיבה שמחייבות יותר אינטליגנציה
(התכונה הוצאה משימוש ב-15 בפברואר 2025) Gemini 1.0 Pro
gemini-1.0-pro
טקסט טקסט משימות בשפה טבעית, שיחות טקסט וקוד עם זיכרון ויצירת קוד
הטמעת טקסט
text-embedding-004
טקסט הטמעת טקסט מדידת הקשר בין מחרוזות טקסט
AQA
aqa
טקסט טקסט מתן תשובות לשאלות שמבוססות על מקורות

(ניסיוני) Gemini 2.0 Flash

ב-Gemini 2.0 Flash יש תכונות דור שני ויכולות משופרות, כולל מהירות גבוהה יותר, שימוש בכלים מקומיים, יצירת מודלים מסוגים שונים וחלון הקשר של מיליון אסימונים. מידע נוסף על Gemini 2.0 Flash זמין בדף הסקירה הכללית.

לניסיון ב-Google AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-2.0-flash-exp
סוגי הנתונים הנתמכים

נתונים

אודיו, תמונות, סרטונים וטקסט

פלט

אודיו (בקרוב), תמונות (בקרוב) וטקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

1,048,576

מגבלה על אסימוני פלט

8,192

הגבלות קצב[**]
  • 10 סל״ד
  • 4 מיליון TPM
  • 1,500 RPD
היכולות של

פלטים מובְנים

נתמך

אחסון במטמון

לא נתמך

כוונון

לא נתמך

קריאה לפונקציה

נתמך

ביצוע קוד

נתמך

חיפוש

נתמך

יצירת תמונות

נתמך

שימוש בכלים מקומיים

נתמך

יצירת אודיו

נתמך

Versions
למידע נוסף, אפשר לקרוא את המאמר בנושא תבניות של גרסאות מודלים.
  • החדש ביותר: gemini-2.0-flash-exp
העדכון האחרון דצמבר 2024

Gemini 1.5 Flash

Gemini 1.5 Flash הוא מודל מהיר ומגוון עם תמיכה במגוון מודלים, שמאפשר להתאים את עצמו למשימות מגוונות.

לניסיון ב-Google AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-1.5-flash
סוגי הנתונים הנתמכים

נתונים

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

1,048,576

מגבלה על אסימוני פלט

8,192

מפרטים של אודיו/וידאו

מספר התמונות המקסימלי לכל הנחיה

3,600

אורך הסרטון המקסימלי

שעה אחת

אורך האודיו המקסימלי

כ-9.5 שעות

הגבלות קצב[**]
בחינם:
  • 15 סיבובים לדקה
  • 1 מיליון TPM
  • 1,500 RPD
Pay-as-you-go:
  • 2,000 סל״ד
  • 4 מיליון TPM
היכולות של

הוראות למערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות שניתן לשנות

נתמך

אחסון במטמון

נתמך

כוונון

נתמך

קריאה לפונקציה

נתמך

ביצוע קוד

נתמך

סטרימינג דו-כיווני

לא נתמך

Versions
למידע נוסף, אפשר לקרוא את המאמר בנושא תבניות של גרסאות מודלים.
  • החדש ביותר: gemini-1.5-flash-latest
  • הגרסה היציבה האחרונה: gemini-1.5-flash
  • יציב:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
העדכון האחרון ספטמבר 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B הוא מודל קטן שמיועד למשימות עם רמת אינטליגנציה נמוכה יותר.

לניסיון ב-Google AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-1.5-flash-8b
סוגי הנתונים הנתמכים

נתונים

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

1,048,576

מגבלה על אסימוני פלט

8,192

מפרטים של אודיו/וידאו

מספר התמונות המקסימלי לכל הנחיה

3,600

אורך הסרטון המקסימלי

שעה אחת

אורך האודיו המקסימלי

כ-9.5 שעות

הגבלות קצב[**]
בחינם:
  • 15 סיבובים לדקה
  • 1 מיליון TPM
  • 1,500 RPD
Pay-as-you-go:
  • 4,000 סל״ד
  • 4 מיליון TPM
היכולות של

הוראות למערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות שניתן לשנות

נתמך

אחסון במטמון

נתמך

כוונון

נתמך

קריאה לפונקציה

נתמך

ביצוע קוד

נתמך

סטרימינג דו-כיווני

לא נתמך

Versions
למידע נוסף, אפשר לקרוא את המאמר בנושא תבניות של גרסאות מודלים.
  • החדש ביותר: gemini-1.5-flash-8b-latest
  • הגרסה היציבה האחרונה: gemini-1.5-flash-8b
  • יציב:
    • gemini-1.5-flash-8b-001
העדכון האחרון אוקטובר 2024

Gemini 1.5 Pro

Gemini 1.5 Pro הוא מודל רב-מודלי בגודל בינוני שעובר אופטימיזציה למגוון רחב של משימות לוגיות. 1.5 Pro יכול לעבד כמויות גדולות של נתונים בו-זמנית, כולל שעתיים של וידאו, 19 שעות של אודיו, בסיסים של קוד עם 60,000 שורות קוד או 2,000 דפי טקסט.

לניסיון ב-Google AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-1.5-pro
סוגי הנתונים הנתמכים

נתונים

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

2,097,152

מגבלה על אסימוני פלט

8,192

מפרטים של אודיו/וידאו

מספר התמונות המקסימלי לכל הנחיה

7,200

אורך הסרטון המקסימלי

שעתיים

אורך האודיו המקסימלי

כ-19 שעות

הגבלות קצב[**]
בחינם:
  • 2 RPM
  • 32,000 TPM
  • 50 RPD
Pay-as-you-go:
  • 1,000 סל״ד
  • 4 מיליון TPM
היכולות של

הוראות למערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות שניתן לשנות

נתמך

אחסון במטמון

נתמך

כוונון

לא נתמך

קריאה לפונקציה

נתמך

ביצוע קוד

נתמך

סטרימינג דו-כיווני

לא נתמך

Versions
למידע נוסף, אפשר לקרוא את המאמר בנושא תבניות של גרסאות מודלים.
  • החדש ביותר: gemini-1.5-pro-latest
  • הגרסה היציבה האחרונה: gemini-1.5-pro
  • יציב:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
העדכון האחרון ספטמבר 2024

(הווצא משימוש) Gemini 1.0 Pro

Gemini 1.0 Pro הוא מודל NLP שמטפל במשימות כמו שיחות טקסט וקוד בכמה סבבים ויצירת קוד.

לניסיון ב-Google AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-1.0-pro
סוגי הנתונים הנתמכים

קלט

טקסט

פלט

טקסט

הגבלות קצב[**]
בחינם:
  • 15 סיבובים לדקה
  • 32,000 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 360 סל״ד
  • 120,000 TPM
  • 30,000 RPD
היכולות של

הוראות למערכת

לא נתמך

מצב JSON

לא נתמך

סכימת JSON

לא נתמך

הגדרות בטיחות שניתן לשנות

נתמך

אחסון במטמון

לא נתמך

כוונון

נתמך

קריאה לפונקציה

נתמך

הגדרת קריאה לפונקציה

לא נתמך

ביצוע קוד

לא נתמך

סטרימינג דו-כיווני

לא נתמך

Versions
  • החדש ביותר: gemini-1.0-pro-latest
  • הגרסה היציבה האחרונה: gemini-1.0-pro
  • יציבה: gemini-1.0-pro-001
העדכון האחרון פברואר 2024

הטמעת טקסט והטמעה

הטמעת טקסט

הטמעות טקסט משמשות למדידת הקשר בין מחרוזות, והן נפוצות מאוד באפליקציות רבות של AI.

text-embedding-004 משיג ביצועי אחזור טובים יותר ומנצח מודלים קיימים עם מאפיינים דומים, במבחני ההטמעה הרגילים של MTEB.

פרטי דגם
נכס תיאור
קוד הדגם

Gemini API

models/text-embedding-004

סוגי הנתונים הנתמכים

קלט

טקסט

פלט

הטמעת טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

2,048

גודל המאפיין בפלט

768

הגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות שניתן לשנות לא נתמך
העדכון האחרון אפריל 2024

הטמעה

אפשר להשתמש במודל הטמעת הטקסט כדי ליצור טקסטים מוטמעים לטקסט הקלט.

מודל הטמעת הטקסט עבר אופטימיזציה ליצירת הטמעות עם 768 מאפיינים לטקסט של עד 2,048 אסימונים.

הטמעת פרטי המודל
נכס תיאור
קוד הדגם models/embedding-001
סוגי הנתונים הנתמכים

קלט

טקסט

פלט

הטמעת טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

2,048

גודל המאפיין בפלט

768

הגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות שניתן לשנות לא נתמך
העדכון האחרון דצמבר 2023

AQA

אפשר להשתמש במודל AQA כדי לבצע משימות שקשורות למענה על שאלות עם שיוך (AQA) במסמך, בקורpus או בקבוצת קטעים. המודל של AQA מחזיר תשובות לשאלות שמבוססות על מקורות שסופקו, יחד עם הערכה של הסבירות לקבלת תשובה.

פרטי דגם

נכס תיאור
קוד הדגם models/aqa
סוגי הנתונים הנתמכים

קלט

טקסט

פלט

טקסט

שפה נתמכת אנגלית
מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

7,168

מגבלה על אסימוני פלט

1,024

הגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות שניתן לשנות נתמך
העדכון האחרון דצמבר 2023

בדוגמאות תוכלו לראות את היכולות של הווריאציות האלה של המודלים.

[*] אסימון שווה לכ-4 תווים במודלים של Gemini. 100 אסימונים הם בערך 60-80 מילים באנגלית.

[**] RPM: בקשות לדקה
TPM: טוקנים לדקה
RPD: בקשות ליום
TPD: טוקנים ליום

עקב מגבלות קיבולת, לא מובטחות המגבלות המקסימליות שצוינו לשיעור שליחה.

דפוסים של שמות של גרסאות של מודלים

המודלים של Gemini זמינים בגרסאות preview או stable. בקוד, אפשר להשתמש באחד מהפורמטים הבאים של שם הדגם כדי לציין את הדגם והגרסה שבהם רוצים להשתמש.

  • Latest: מפנה לגרסה העדכנית ביותר של המודל לדור ולוריאנט מסוימים. המודל הבסיסי מתעדכן באופן קבוע, ויכול להיות שהוא יהיה בגרסה טרום-השקה. יש להשתמש בכתובת האימייל החלופית הזו רק באפליקציות ובאב טיפוס לבדיקה exploratorie.

    כדי לציין את הגרסה האחרונה, משתמשים בתבנית הבאה: <model>-<generation>-<variation>-latest. לדוגמה, gemini-1.0-pro-latest.

  • הגרסה היציבה האחרונה: מפנה לגרסה היציבה האחרונה שפורסמה לדור ולגרסה של המודל שצוינו.

    כדי לציין את הגרסה היציבה האחרונה, משתמשים בתבנית הבאה: <model>-<generation>-<variation>. לדוגמה, gemini-1.0-pro.

  • יציב: מפנה למודל יציב ספציפי. מודלים יציבים לא משתנים. ברוב האפליקציות בסביבת הייצור צריך להשתמש בדגם יציב ספציפי.

    כדי לציין גרסה יציבה, משתמשים בתבנית הבאה: <model>-<generation>-<variation>-<version>. לדוגמה, gemini-1.0-pro-001.

  • ניסיוני: מציין מודל ניסיוני שזמין בתצוגה המקדימה, כפי שמוגדר בתנאים, כלומר הוא לא מיועד לשימוש בסביבת הייצור. אנחנו משיקים מודלים ניסיוניים כדי לקבל משוב, כדי להעביר במהירות את העדכונים האחרונים למפתחים וכדי להדגיש את קצב החדשנות ב-Google. מה שאנחנו לומדים מההשקות הניסיוניות עוזר לנו להחליט איך להשיק את המודלים באופן נרחב יותר. אפשר להחליף מודל ניסיוני במודל אחר ללא הודעה מוקדמת. אנחנו לא מתחייבים שמודל ניסיוני יהפוך למודל יציב בעתיד.

    כדי לציין גרסה ניסיונית, משתמשים בתבנית הבאה: <model>-<generation>-<variation>-<version>. לדוגמה, gemini-exp-1121.

השפות הזמינות

מודלים של Gemini מאומנים לעבוד עם השפות הבאות:

  • ערבית (ar)
  • בנגלית (bn)
  • בולגרית (bg)
  • סינית פשוטה ומסורתית (zh)
  • קרואטית (hr)
  • צ'כית (cs)
  • דנית (da)
  • הולנדית (nl)
  • אנגלית (en)
  • אסטונית (et)
  • פינית (fi)
  • צרפתית (fr)
  • גרמנית (de)
  • יוונית (el)
  • עברית (iw)
  • הינדי (hi)
  • הונגרית (hu)
  • אינדונזית (id)
  • איטלקית (it)
  • יפנית (ja)
  • קוריאנית (ko)
  • לטבית (lv)
  • ליטאית (lt)
  • נורווגית (no)
  • פולנית (pl)
  • פורטוגזית (pt)
  • רומנית (ro)
  • רוסית (ru)
  • סרבית (sr)
  • סלובקית (sk)
  • סלובנית (sl)
  • ספרדית (es)
  • סווהילי (sw)
  • שוודית (sv)
  • תאילנדית (th)
  • טורקית (tr)
  • אוקראינית (uk)
  • וייטנאמית (vi)