1.5 Flash
המודל המאוזן ביותר שלנו עם מגוון מודלים, שמציג ביצועים מעולים ברוב המשימות
- להזין אודיו, תמונות, סרטונים וטקסט ולקבל תשובות בטקסט
- יצירת קוד, חילוץ נתונים, עריכת טקסט ועוד
- מתאים במיוחד למשימות שבהן צריך לאזן בין ביצועים לעלויות
וריאנטים של מודלים
ב-Gemini API יש מודלים שונים שעברו אופטימיזציה לתרחישים ספציפיים של שימוש. הנה סקירה כללית קצרה של הווריאנטים של Gemini שזמינים:
וריאנט של מודל | קלט | פלט | אופטימיזציה עבור |
---|---|---|---|
Gemini 1.5 Flash
gemini-1.5-flash |
אודיו, תמונות, סרטונים וטקסט | טקסט | ביצועים מהירים ורב-תכליתיים במגוון רחב של משימות |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
אודיו, תמונות, סרטונים וטקסט | טקסט | משימות בנפח גבוה וברמת אינטליגנציה נמוכה יותר |
Gemini 1.5 Pro
gemini-1.5-pro |
אודיו, תמונות, סרטונים וטקסט | טקסט | משימות מורכבות של חשיבה שמחייבות יותר אינטליגנציה |
Gemini 1.0 Pro (הוצא משימוש ב-15 בפברואר 2025)
gemini-1.0-pro |
טקסט | טקסט | משימות בשפה טבעית, שיחות טקסט וקוד עם זיכרון ויצירת קוד |
הטמעת טקסט
text-embedding-004 |
טקסט | הטמעת טקסט | מדידת הקשר בין מחרוזות טקסט |
AQA
aqa |
טקסט | טקסט | מתן תשובות לשאלות שמבוססות על מקורות |
Gemini 1.5 Flash
Gemini 1.5 Flash הוא מודל מהיר ומגוון עם תמיכה במגוון מודלים, שמאפשר להתאים את עצמו למשימות מגוונות.
פרטי דגם
נכס | תיאור |
---|---|
קוד הדגם | models/gemini-1.5-flash |
סוגי הנתונים הנתמכים |
נתונים אודיו, תמונות, סרטונים וטקסט פלט טקסט |
[*] | מגבלות על אסימונים
מגבלה על אסימוני קלט 1,048,576 מגבלה על אסימוני פלט 8,192 |
מפרטים של אודיו/וידאו |
מספר התמונות המקסימלי לכל הנחיה 3,600 אורך הסרטון המקסימלי שעה אחת אורך האודיו המקסימלי כ-9.5 שעות |
[**] | הגבלות קצב
|
יכולות של |
הוראות למערכת נתמך מצב JSON נתמך סכימת JSON נתמך הגדרות בטיחות שניתן לשנות נתמך אחסון במטמון נתמך כוונון נתמך קריאה לפונקציה נתמך ביצוע קוד נתמך |
Versions |
|
העדכון האחרון | ספטמבר 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B הוא מודל קטן שמיועד למשימות עם רמת אינטליגנציה נמוכה יותר.
פרטי דגם
נכס | תיאור |
---|---|
קוד הדגם | models/gemini-1.5-flash-8b |
סוגי הנתונים הנתמכים |
נתונים אודיו, תמונות, סרטונים וטקסט פלט טקסט |
[*] | מגבלות על אסימונים
מגבלה על אסימוני קלט 1,048,576 מגבלה על אסימוני פלט 8,192 |
מפרטים של אודיו/וידאו |
מספר התמונות המקסימלי לכל הנחיה 3,600 אורך הסרטון המקסימלי שעה אחת אורך האודיו המקסימלי כ-9.5 שעות |
[**] | הגבלות קצב
|
יכולות של |
הוראות למערכת נתמך מצב JSON נתמך סכימת JSON נתמך הגדרות בטיחות שניתן לשנות נתמך אחסון במטמון נתמך כוונון נתמך קריאה לפונקציה נתמך ביצוע קוד נתמך |
Versions |
|
העדכון האחרון | אוקטובר 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro הוא מודל רב-מודלי בגודל בינוני שעובר אופטימיזציה למגוון רחב של משימות לוגיות. 1.5 Pro יכול לעבד כמויות גדולות של נתונים בו-זמנית, כולל שעתיים של וידאו, 19 שעות של אודיו, בסיסים של קוד עם 60,000 שורות קוד או 2,000 דפי טקסט.
פרטי דגם
נכס | תיאור |
---|---|
קוד הדגם | models/gemini-1.5-pro |
סוגי הנתונים הנתמכים |
נתונים אודיו, תמונות, סרטונים וטקסט פלט טקסט |
[*] | מגבלות על אסימונים
מגבלה על אסימוני קלט 2,097,152 מגבלה על אסימוני פלט 8,192 |
מפרטים של אודיו/וידאו |
מספר התמונות המקסימלי לכל הנחיה 7,200 אורך הסרטון המקסימלי שעתיים אורך האודיו המקסימלי כ-19 שעות |
[**] | הגבלות קצב
|
יכולות של |
הוראות למערכת נתמך מצב JSON נתמך סכימת JSON נתמך הגדרות בטיחות שניתן לשנות נתמך אחסון במטמון נתמך כוונון לא נתמך קריאה לפונקציה נתמך ביצוע קוד נתמך |
Versions |
|
העדכון האחרון | ספטמבר 2024 |
Gemini 1.0 Pro (הווצא משימוש)
Gemini 1.0 Pro הוא מודל NLP שמטפל במשימות כמו שיחות טקסט וקוד בכמה סבבים ויצירת קוד.
פרטי דגם
נכס | תיאור |
---|---|
קוד הדגם | models/gemini-1.0-pro |
סוגי הנתונים הנתמכים |
קלט טקסט פלט טקסט |
[**] | הגבלות קצב
|
יכולות של |
הוראות למערכת לא נתמך מצב JSON לא נתמך סכימת JSON לא נתמך הגדרות בטיחות שניתן לשנות נתמך אחסון במטמון לא נתמך כוונון נתמך קריאה לפונקציה נתמך הגדרת קריאה לפונקציה לא נתמך ביצוע קוד לא נתמך |
Versions |
|
העדכון האחרון | פברואר 2024 |
הטמעת טקסט והטמעה
הטמעת טקסט
הטמעות טקסט משמשות למדידת הקשר בין מחרוזות, והן נמצאות בשימוש נרחב באפליקציות רבות של AI.
text-embedding-004
משיג ביצועי אחזור טובים יותר ומנצח מודלים קיימים
עם מאפיינים דומים, במבחני ההטמעה הרגילים של MTEB.
פרטי דגם
נכס | תיאור |
---|---|
קוד הדגם |
Gemini API
|
סוגי הנתונים הנתמכים |
קלט טקסט פלט הטמעת טקסט |
[*] | מגבלות על אסימונים
מגבלה על אסימוני קלט 2,048 גודל המאפיין בפלט 768 |
[**] | הגבלות קצב1,500 בקשות לדקה |
הגדרות בטיחות | שניתן לשנותלא נתמך |
העדכון האחרון | אפריל 2024 |
הטמעה
אפשר להשתמש במודל הטמעת הטקסט כדי ליצור טקסטים מוטמעים לטקסט הקלט.
מודל הטמעת הטקסט עבר אופטימיזציה ליצירת הטמעות עם 768 מאפיינים לטקסט של עד 2,048 אסימונים.
הטמעת פרטי המודל
נכס | תיאור |
---|---|
קוד הדגם |
models/embedding-001
|
סוגי הנתונים הנתמכים |
קלט טקסט פלט הטמעת טקסט |
[*] | מגבלות על אסימונים
מגבלה על אסימוני קלט 2,048 גודל המאפיין בפלט 768 |
[**] | הגבלות קצב1,500 בקשות לדקה |
הגדרות בטיחות | שניתן לשנותלא נתמך |
העדכון האחרון | דצמבר 2023 |
AQA
אפשר להשתמש במודל AQA כדי לבצע משימות שקשורות למענה על שאלות עם שיוך לפרטים (AQA) במסמך, בקורpus או בקבוצת קטעים. המודל של AQA מחזיר תשובות לשאלות שמבוססות על מקורות שסופקו, יחד עם הערכה של הסבירות לקבלת תשובה.
פרטי דגם
נכס | תיאור |
---|---|
קוד הדגם | models/aqa |
סוגי הנתונים הנתמכים |
קלט טקסט פלט טקסט |
שפה נתמכת | אנגלית |
[*] | מגבלות על אסימונים
מגבלה על אסימוני קלט 7,168 מגבלה על אסימוני פלט 1,024 |
[**] | הגבלות קצב1,500 בקשות לדקה |
הגדרות בטיחות | שניתן לשנותנתמך |
העדכון האחרון | דצמבר 2023 |
בדוגמאות תוכלו לראות את היכולות של הווריאציות האלה של המודלים.
[*] אסימון שווה לכ-4 תווים במודלים של Gemini. 100 אסימונים הם כ-60 עד 80 מילים באנגלית.
[**] RPM: בקשות לדקה
TPM: טוקנים לדקה
RPD: בקשות ליום
TPD: טוקנים ליום
עקב מגבלות קיבולת, לא מובטחות המגבלות המקסימליות שצוינו לשיעור שליחה.
דפוסים של שמות של גרסאות של מודלים
מודלים של Gemini זמינים בגרסת טרום-השקה או בגרסת יציבה. בקוד, אפשר להשתמש באחד מהפורמטים הבאים של שם הדגם כדי לציין את הדגם והגרסה שבהם רוצים להשתמש.
Latest: מפנה לגרסה העדכנית ביותר של המודל לדור ולוריאנט מסוימים. המודל הבסיסי מתעדכן באופן קבוע, ויכול להיות שהוא בגרסה טרום-השקה. מומלץ להשתמש בכתובת החלופית הזו רק באפליקציות ובאב טיפוס לבדיקה exploratorie.
כדי לציין את הגרסה העדכנית ביותר, משתמשים בתבנית הבאה:
<model>-<generation>-<variation>-latest
. לדוגמה,gemini-1.0-pro-latest
.הגרסה היציבה האחרונה: מפנה לגרסה היציבה האחרונה שפורסמה לדור ולגרסה של המודל שצוינו.
כדי לציין את הגרסה היציבה האחרונה, צריך להשתמש בתבנית הבאה:
<model>-<generation>-<variation>
. לדוגמה,gemini-1.0-pro
.יציב: מפנה למודל יציב ספציפי. מודלים יציבים לא משתנים. ברוב האפליקציות בסביבת הייצור צריך להשתמש בדגם יציב ספציפי.
כדי לציין גרסה יציבה, משתמשים בתבנית הבאה:
<model>-<generation>-<variation>-<version>
. לדוגמה,gemini-1.0-pro-001
.ניסיוני: מציין מודל ניסיוני שזמין בתצוגה המקדימה, כפי שמוגדר בתנאים, כלומר הוא לא מיועד לשימוש בסביבת הייצור. אנחנו משיקים מודלים ניסיוניים כדי לקבל משוב, כדי להעביר במהירות את העדכונים האחרונים למפתחים וכדי להדגיש את קצב החדשנות ב-Google. מה שאנחנו לומדים מההשקות הניסיוניות עוזר לנו להחליט איך להשיק את המודלים באופן נרחב יותר. אפשר להחליף מודל ניסיוני במודל אחר ללא הודעה מוקדמת. אנחנו לא מתחייבים שמודל ניסיוני יהפוך למודל יציב בעתיד.
כדי לציין גרסה ניסיונית, משתמשים בתבנית הבאה:
<model>-<generation>-<variation>-<version>
. לדוגמה,gemini-exp-1121
.
השפות הזמינות
מודלים של Gemini מאומנים לעבוד עם השפות הבאות:
- ערבית (
ar
) - בנגלית (
bn
) - בולגרית (
bg
) - סינית פשוטה ומסורתית (
zh
) - קרואטית (
hr
) - צ'כית (
cs
) - דנית (
da
) - הולנדית (
nl
) - אנגלית (
en
) - אסטונית (
et
) - פינית (
fi
) - צרפתית (
fr
) - גרמנית (
de
) - יוונית (
el
) - עברית (
iw
) - הינדי (
hi
) - הונגרית (
hu
) - אינדונזית (
id
) - איטלקית (
it
) - יפנית (
ja
) - קוריאנית (
ko
) - לטבית (
lv
) - ליטאית (
lt
) - נורווגית (
no
) - פולנית (
pl
) - פורטוגזית (
pt
) - רומנית (
ro
) - רוסית (
ru
) - סרבית (
sr
) - סלובקית (
sk
) - סלובנית (
sl
) - ספרדית (
es
) - סווהילי (
sw
) - שוודית (
sv
) - תאילנדית (
th
) - טורקית (
tr
) - אוקראינית (
uk
) - וייטנאמית (
vi
)