Gemini

Gemini היא קבוצת מודלים של בינה מלאכותית גנרטיבית שמאפשרת למפתחים ליצור תוכן ולפתור בעיות. המודלים האלה מתוכננים ומאומנים לטפל גם בטקסט וגם בתמונות כקלט. המדריך הזה כולל מידע על כל וריאציה של הדגם, כדי להחליט איזו וריאציה הכי מתאימה לתרחיש לדוגמה שלכם.

השפות הזמינות

המודלים של Gemini מאומנים לעבודה עם השפות הבאות: {8/ {3/ Gemini), ערבית (3/ 3), בנגאלית (bn3), בנגאלית (bn3), {200בנגאלית (bn), בנגאלית (bn2), {200{2/7} בנגאלית, {8/ 5}בצרפתית, {12/20}arbgzhhrcsdanlenetfifrdeeliwhihuiditjakolvltnoplptrorusrskslesswsvthtrukvi

מודלים של PaLM פועלים טוב רק באנגלית. שימוש בשפות אחרות עלול להוביל לתוצאות בלתי צפויות.

וריאציות של דגם

ב-Gemini API יש מודלים שונים שמותאמים לתרחישי שימוש ספציפיים. סקירה כללית קצרה של הווריאציות הזמינות של Gemini:

גרסת הדגם קלט(קלט) פלט אופטימיזציה עבור
Gemini 1.5 Pro (תצוגה מקדימה) אודיו, תמונות, סרטונים וטקסט טקסט סיבות למשימות, כולל, בין היתר, יצירת קוד וטקסט, עריכת טקסט, פתרון בעיות, חילוץ נתונים ויצירה
Gemini 1.5 Flash (תצוגה מקדימה) אודיו, תמונות, סרטונים וטקסט טקסט ביצועים מהירים ומגוונים במגוון משימות
Gemini 1.0 Pro טקסט טקסט משימות בשפה טבעית, צ'אט עם קוד וטקסט מרובה פניות ויצירת קודים
Gemini 1.0 Pro Vision תמונות, סרטונים וטקסט טקסט הביצועים עברו אופטימיזציה למשימות שקשורות מבחינה ויזואלית, כמו יצירת תיאורי תמונות או זיהוי אובייקטים בתמונות
הטמעת טקסט טקסט הטמעות טקסט יצירת הטמעות טקסט אלסטיות עם עד 768 מימדים לטקסט עם עד 2,048 אסימונים
הטמעה טקסט הטמעות טקסט יצירה של הטמעות טקסט עם 768 מימדים עבור טקסט שמכיל עד 2,048 אסימונים
AQA טקסט טקסט ביצוע משימות שקשורות למענה על שאלות שמשויכות לטקסט שסופק

בטבלה הבאה מפורטים המאפיינים של המודלים של Gemini שמשותפים לכל הווריאציות של המודלים:

מאפיין תיאור
נתוני אימון המועד האחרון למילוי הידע של Gemini הוא בתחילת 2023. הידע על אירועים לאחר מועד זה מוגבל.
שפות נתמכות להצגת השפות הזמינות
פרמטרים של מודל שניתן להגדיר
  • המיקום העליון
  • K מובילים
  • טמפרטורה
  • הפסקת הרצף
  • אורך פלט מקסימלי
  • מספר התשובות האפשריות

מידע על כל אחד מהפרמטרים האלה מופיע במדריך בנושא מודלים גנרטיביים בקטע בנושא פרמטרים של מודלים.

Gemini 1.5 Pro (תצוגה מקדימה)

Gemini 1.5 Pro הוא מודל מרובה מצבים בגודל בינוני שמותאם למגוון רחב של משימות של הסקת מסקנות, כמו:

  • יצירת קוד
  • יצירת טקסט
  • עריכת טקסט
  • פתרון בעיות
  • יצירת המלצות
  • חילוץ מידע
  • חילוץ או יצירה של נתונים
  • יצירה של סוכני AI

1.5 Pro יכול לעבד כמויות גדולות של נתונים בו-זמנית, כולל שעה אחת של וידאו, 9.5 שעות של אודיו, קובצי קוד עם יותר מ-30,000 שורות קוד או יותר מ-700,000 מילים.

1.5 Pro יכול לטפל במשימות למידה מסוג אפס, חד-פעמיות וכמה דוגמאות.

פרטי דגם

מאפיין (property) תיאור
קוד הדגם models/gemini-1.5-pro-latest
קלט אודיו, תמונות, סרטונים וטקסט
פלט טקסט
שיטות היצירה הנתמכות generateContent
מגבלת קלט לאסימונים[**] 1,048,576
מגבלת אסימוני פלט[**] 8,192
מספר תמונות מקסימלי לכל הנחיה 3,600
אורך סרטון מקסימלי שעה אחת
אורך אודיו מקסימלי כ-9.5 שעות
המספר המקסימלי של קובצי אודיו בכל הנחיה 1
בטיחות המודל הגדרות בטיחות שמופעלות באופן אוטומטי וניתנות להתאמה על ידי המפתחים. לפרטים נוספים, אפשר לעיין בדף בנושא הגדרות בטיחות.
מגבלות קצב של יצירת בקשות[*]
בחינם:
  • 2 סל״ד
  • 32,000 TPM
  • RPD 50
  • 46,080,000 TPD
Pay-as-you-go:
  • 360 סל״ד
  • 10 מיליון מודולי פלטפורמה מהימנים (TPM)
  • 10,000 RPD
  • TPD 14,400,000,000
שני מיליון הקשר:
  • 1 סל״ד
  • 2 מיליון מודולי פלטפורמה מהימנים (TPM)
  • RPD 50
הוראות מערכת נתמך
מצב JSON נתמך
הגרסה האחרונה gemini-1.5-pro-latest
הגרסה היציבה האחרונה gemini-1.5-pro
העדכון האחרון אפריל 2024

Gemini 1.5 Flash (תצוגה מקדימה)

Gemini 1.5 Flash הוא מודל רב-אופני מהיר ורב-תכליתי שמאפשר לבצע התאמה לעומס (scaling) בין משימות מגוונות.

פרטי דגם

מאפיין (property) תיאור
קוד הדגם gemini-1.5-flash-latest
קלט(קלט) אודיו, תמונות, סרטונים וטקסט
פלט טקסט
שיטות היצירה הנתמכות generateContent
מגבלת קלט לאסימונים[**] 1,048,576
מגבלת אסימוני פלט[**] 8,192
מספר תמונות מקסימלי לכל הנחיה 3,600
אורך סרטון מקסימלי שעה אחת
אורך אודיו מקסימלי כ-9.5 שעות
המספר המקסימלי של קובצי אודיו בכל הנחיה 1
בטיחות המודל הגדרות בטיחות שמופעלות באופן אוטומטי וניתנות להתאמה על ידי המפתחים. לפרטים נוספים, אפשר לעיין בדף בנושא הגדרות בטיחות.
מגבלות קצב של יצירת בקשות[*]
בחינם:
  • 15 סל״ד
  • מיליון מודולי פלטפורמה מהימנים (TPM)
  • 1,500 RPD
Pay-as-you-go:
  • 360 סל״ד
  • 10 מיליון מודולי פלטפורמה מהימנים (TPM)
  • 10,000 RPD
הוראות מערכת נתמך
מצב JSON נתמך
הגרסה האחרונה gemini-1.5-flash-latest
הגרסה היציבה האחרונה gemini-1.5-flash

Gemini 1.0 Pro

Gemini 1.0 Pro הוא מודל NLP לטיפול במשימות כמו יצירת קוד ושליחת טקסט בצ'אט עם מספר פניות.

1.0 Pro יכול לטפל במשימות למידה מסוג אפס, חד-פעמיות וכמה דוגמאות.

פרטי דגם

מאפיין (property) תיאור
קוד הדגם models/gemini-pro
קלט טקסט
פלט טקסט
שיטות היצירה הנתמכות
Python: generate_content
REST: generateContent
מגבלות קצב של יצירת בקשות[*]
בחינם:
  • 15 סל״ד
  • 32,000 TPM
  • 1,500 RPD
  • 46,080,000 TPD
Pay-as-you-go:
  • 360 סל״ד
  • 120,000 TPM
  • 30,000 RPD
  • 172,800,000 TPD
הוראות מערכת לא נתמך
מצב JSON לא נתמך
הגרסה האחרונה gemini-1.0-pro-latest
הגרסה היציבה האחרונה gemini-1.0-pro
גרסאות יציבות gemini-1.0-pro-001
העדכון האחרון פברואר 2024

Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision הוא מודל רב-אופני שעבר אופטימיזציה לביצועים, ויכול לבצע משימות שקשורות ויזואלית. לדוגמה, 1.0 Pro Vision יכול ליצור תיאורי תמונות, לזהות אובייקטים שמופיעים בתמונות, לספק מידע על מקומות או אובייקטים שמופיעים בתמונות ועוד.

1.0 Pro Vision יכול לטפל במשימות מסוג אפס, חד-פעמיות וכמה דוגמאות.

פרטי דגם

מאפיין (property) תיאור
קוד הדגם models/gemini-pro-vision
קלט טקסט, סרטונים ותמונות
פלט טקסט
שיטות היצירה הנתמכות
Python: generate_content
REST: generateContent
מגבלת קלט לאסימון[*] 12,288
מגבלת אסימון פלט[*] 4,096
גודל תמונה מקסימלי אין מגבלה
מספר תמונות מקסימלי לכל הנחיה 16
אורך סרטון מקסימלי שתי דקות
מספר סרטונים מקסימלי לכל הנחיה 1
בטיחות המודל הגדרות בטיחות שמופעלות באופן אוטומטי וניתנות להתאמה על ידי המפתחים. לפרטים נוספים, אפשר לעיין בדף בנושא הגדרות בטיחות.
מגבלת קצב של יצירת בקשות[*] 60 בקשות בדקה
הגרסה האחרונה gemini-1.0-pro-vision-latest
הגרסה היציבה האחרונה gemini-1.0-pro-vision
העדכון האחרון דצמבר 2023

הטמעה והטמעה של טקסט

הטמעת טקסט

אפשר להשתמש במודל 'הטמעת טקסט' כדי ליצור הטמעות טקסט לטקסט שהוזן. מידע נוסף על המודל 'הטמעת טקסט' זמין במסמכי התיעוד של AI גנרטיבי ב-Vertex AI.

המודל 'הטמעת טקסט' עבר אופטימיזציה ליצירת הטמעות עם 768 מידות לטקסט של עד 2,048 אסימונים. הטמעת טקסט מאפשרת הטמעה אלסטית בגדלים של עד 768. אפשר להשתמש בהטמעות אלסטיות כדי ליצור מידות פלט קטנות יותר ואולי לחסוך בעלויות מחשוב ואחסון עם הפסד קל של ביצועים.

פרטי דגם
מאפיין (property) תיאור
קוד הדגם models/text-embedding-004 (text-embedding-preview-0409 ב-Vertex AI)
קלט טקסט
פלט הטמעות טקסט
מגבלת קלט לאסימונים 2,048
גודל מידות הפלט 768
שיטות היצירה הנתמכות
Python: embed_content
REST: embedContent
בטיחות המודל אין הגדרות בטיחות שניתן לשנות.
מגבלת קצב של יצירת בקשות[*] 1,500 בקשות לדקה
העדכון האחרון אפריל 2024

הטמעה

אפשר להשתמש במודל ההטמעה כדי ליצור הטמעות טקסט לטקסט שהוזן.

מודל ההטמעה עבר אופטימיזציה ליצירת הטמעות עם 768 מימדים לטקסט של עד 2,048 אסימונים.

פרטי המודל מטמיעים
מאפיין (property) תיאור
קוד הדגם models/embedding-001
קלט טקסט
פלט הטמעות טקסט
מגבלת קלט לאסימונים 2,048
גודל מידות הפלט 768
שיטות היצירה הנתמכות
Python: embed_content
REST: embedContent
בטיחות המודל אין הגדרות בטיחות שניתן לשנות.
מגבלת קצב של יצירת בקשות[*] 1,500 בקשות לדקה
העדכון האחרון דצמבר 2023

בקרת איכות

אפשר להשתמש במודל AQA כדי לבצע משימות שקשורות לתשובות לשאלות משויכות (AQA) במסמך, בקורפוס או בקבוצה של מעברים. מודל AQA מחזיר תשובות לשאלות שמתבססות על מקורות נתונים, וגם הערכה של ההסתברות שניתנת לתשובה.

פרטי דגם

מאפיין (property) תיאור
קוד הדגם models/aqa
קלט טקסט
פלט טקסט
שיטות היצירה הנתמכות
Python: GenerateAnswerRequest
REST: generateAnswer
שפות נתמכות אנגלית
מגבלת קלט לאסימונים[**] 7,168
מגבלת אסימוני פלט[**] 1,024
בטיחות המודל הגדרות בטיחות שמופעלות באופן אוטומטי וניתנות להתאמה על ידי המפתחים. לפרטים נוספים, אפשר לעיין בדף בנושא הגדרות בטיחות.
מגבלת קצב של יצירת בקשות[*] 60 בקשות בדקה
העדכון האחרון דצמבר 2023

תוכלו להיעזר בדוגמאות כדי ללמוד על היכולות של הווריאציות האלה של המודל.

[*] אסימון מקביל לכ-4 תווים במודלים של Gemini. 100 אסימונים מכילים בערך 60-80 מילים באנגלית.

[**] RPM: בקשות לדקה
TPM: אסימונים לדקה
RPD: בקשות ליום
TPD: אסימונים ליום

בגלל מגבלות הקיבולת, לא מובטחות הגבלת קצב מקסימלית.

דפוסי השמות של גרסת המודל

המודלים של Gemini זמינים בגרסה תצוגה מקדימה או בגרסה יציבה. בקוד שלכם תוכלו להשתמש באחד מהפורמטים הבאים של שם המודל, כדי לציין באיזה דגם וגרסה אתם רוצים להשתמש.

  • העדכניות ביותר: מצביעה על הגרסה החדשנית של המודל ביחס לגנרציה ולגרסה מסוימת. המודל הבסיסי מתעדכן באופן קבוע, ויכול להיות שהוא גרסת תצוגה מקדימה. אפשר להשתמש בכתובת האימייל הזו רק באפליקציות של כלי הבדיקה ובגרסאות אב טיפוס של בדיקות.

    כדי לציין את הגרסה העדכנית ביותר, משתמשים בדפוס הבא: <model>-<generation>-<variation>-latest. לדוגמה, gemini-1.0-pro-latest.

  • היציבות האחרונה: מצביעה על הגרסה היציבה האחרונה שנוצרה בשביל הגרסה והגנרציה של המודל שצוינו.

    כדי לציין את הגרסה היציבה האחרונה משתמשים בתבנית הבאה: <model>-<generation>-<variation>. לדוגמה: gemini-1.0-pro.

  • יציב: מצביע על מודל יציב ספציפי. מודלים יציבים לא משתנים. לרוב האפליקציות בסביבת הייצור צריך להשתמש במודל יציב ספציפי.

    כדי לציין גרסה יציבה משתמשים בדפוס הבא: <model>-<generation>-<variation>-<version>. לדוגמה, gemini-1.0-pro-001.