1.5 Flash
النموذج الأكثر توازناً بين الوسائط المتعددة والذي يحقّق أداءً رائعًا لمعظم المهام
- إدخال الصوت والصور والفيديوهات والنصوص والحصول على ردود نصية
- إنشاء رموز واستخراج البيانات وتعديل النص وغير ذلك
- الأنسب للمهام التي توازن بين الأداء والتكلفة
خيارات المنتج
توفّر Gemini API نماذج مختلفة محسَّنة لحالات استخدام محدّدة. في ما يلي نظرة عامة موجزة على أنواع Gemini المتاحة:
خيار المنتج | الإدخالات | الناتج | محسَّنة لـ |
---|---|---|---|
Gemini 1.5 Flash
gemini-1.5-flash |
الصوت والصور والفيديوهات والنصوص | نص | أداء سريع ومتعدد الاستخدامات في مجموعة متنوعة من المهام |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
الصوت والصور والفيديوهات والنصوص | نص | المهام ذات الحجم الكبير والذكاء المنخفض |
Gemini 1.5 Pro
gemini-1.5-pro |
الصوت والصور والفيديوهات والنصوص | نص | مهام التفكير المعقدة التي تتطلّب ذكاءً أكبر |
Gemini 1.0 Pro (سيتم إيقافه نهائيًا في 15 شباط (فبراير) 2025)
gemini-1.0-pro |
نص | نص | المهام بلغة طبيعية ومحادثات متعددة النصوص والرموز البرمجية وإنشاء الرموز البرمجية |
تضمين النص
text-embedding-004 |
نص | عمليات تضمين النصوص | قياس مدى صلة سلاسل النصوص ببعضها |
AQA
aqa |
نص | نص | تقديم إجابات مستندة إلى مصادر موثوقة |
Gemini 1.5 Flash
Gemini 1.5 Flash هو نموذج سريع ومتعدد الاستخدامات لأداء مجموعة متنوعة من المهام بكفاءة.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-flash |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص النتيجة نص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 1,048,576 الحد الأقصى لرموز الإخراج 8,192 |
| المواصفات الصوتية/المرئية
الحد الأقصى لعدد الصور لكل طلب 3,600 الحدّ الأقصى لمدة الفيديو ساعة واحدة الحد الأقصى لطول الملف الصوتي 9.5 ساعة تقريبًا |
[**] | حدود السرعة
|
تعليمات النظام متاح وضع JSON متاح مخطّط JSON متاح إعدادات السلامة القابلة للتعديل متاح التخزين المؤقت متاح الضبط متاح استدعاء الدالة متاح تنفيذ الرمز البرمجي متاح |
|
Versions |
|
آخر تعديل | سبتمبر 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B هو نموذج صغير مصمّم للمهام الأقل ذكاءً.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-flash-8b |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص النتيجة نص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 1,048,576 الحد الأقصى لرموز الإخراج 8,192 |
| المواصفات الصوتية/المرئية
الحد الأقصى لعدد الصور لكل طلب 3,600 الحدّ الأقصى لمدة الفيديو ساعة واحدة الحد الأقصى لطول الملف الصوتي 9.5 ساعة تقريبًا |
[**] | حدود السرعة
|
تعليمات النظام متاح وضع JSON متاح مخطّط JSON متاح إعدادات السلامة القابلة للتعديل متاح التخزين المؤقت متاح الضبط متاح استدعاء الدالة متاح تنفيذ الرمز البرمجي متاح |
|
Versions |
|
آخر تعديل | أكتوبر 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro هو نموذج متوسط الحجم متعدد الوسائط تم تحسينه لأداء مجموعة كبيرة من مهام الاستدلال. يمكن لإصدار 1.5 Pro معالجة كميات كبيرة من البيانات في آنٍ واحد، بما في ذلك ساعتان من الفيديوهات أو 19 ساعة من المحتوى الصوتي أو قواعد الرموز البرمجية التي تضم 60,000 سطر من الرموز البرمجية أو 2,000 صفحة من النصوص.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-pro |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص النتيجة نص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 2,097,152 الحد الأقصى لرموز الإخراج 8,192 |
| المواصفات الصوتية/المرئية
الحد الأقصى لعدد الصور لكل طلب 7,200 الحدّ الأقصى لمدة الفيديو ساعتان الحد الأقصى لطول الملف الصوتي 19 ساعة تقريبًا |
[**] | حدود السرعة
|
تعليمات النظام متاح وضع JSON متاح مخطّط JSON متاح إعدادات السلامة القابلة للتعديل متاح التخزين المؤقت متاح الضبط غير متاح استدعاء الدالة متاح تنفيذ الرمز البرمجي متاح |
|
Versions |
|
آخر تعديل | سبتمبر 2024 |
Gemini 1.0 Pro (تم إيقافه نهائيًا)
Gemini 1.0 Pro هو نموذج معالجة لغة طبيعية يعالج مهامًا مثل المحادثات المتعدّدة الجولات التي تتضمّن نصًا و رمزًا برمجيًا وإنشاء رموز برمجية.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.0-pro |
أنواع البيانات المتوافقة |
الإدخال نص النتيجة نص |
[**] | حدود السرعة
|
تعليمات النظام غير متاح وضع JSON غير متاح مخطّط JSON غير متاح إعدادات السلامة القابلة للتعديل متاح التخزين المؤقت غير متاح الضبط متاح استدعاء الدالة متاح إعدادات استدعاء الدوالّ غير متاح تنفيذ الرمز البرمجي غير متاح |
|
Versions |
|
آخر تعديل | شباط (فبراير) 2024 |
تضمين النصوص
تضمين النص
تُستخدَم عمليات إدراج النصوص لقياس مدى صلة السلاسل ببعضها، وهي تُستخدَم على نطاق واسع في العديد من تطبيقات الذكاء الاصطناعي.
يحقّق text-embedding-004
أداءً أفضل في الاسترجاع ويتفوّق على النماذج الحالية
باستخدام سمات مشابهة، وذلك في مقاييس الأداء العادية لدمج MTEB.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز |
Gemini API
|
أنواع البيانات المتوافقة |
الإدخال نص النتيجة عمليات تضمين النصوص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 2,048 حجم سمة الإخراج 768 |
[**] | حدود السرعة1,500 طلب في الدقيقة |
إعدادات أمان | وقابلة للتعديلغير متاح |
آخر تعديل | أبريل 2024 |
التضمين
يمكنك استخدام نموذج "الترميز" لإنشاء نماذج نصية للنص الذي يتم إدخاله.
تم تحسين نموذج "الترميز" لإنشاء نماذج ترميز تتضمّن 768 سمة للنص الذي يصل إلى 2,048 رمزًا.
تضمين تفاصيل النموذج
الموقع | الوصف |
---|---|
رمز الطراز |
models/embedding-001
|
أنواع البيانات المتوافقة |
الإدخال نص النتيجة عمليات تضمين النصوص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 2,048 حجم سمة الإخراج 768 |
[**] | حدود السرعة1,500 طلب في الدقيقة |
إعدادات أمان | وقابلة للتعديلغير متاح |
آخر تعديل | كانون الأول (ديسمبر) 2023 |
AQA
يمكنك استخدام نموذج AQA لتنفيذ مهام مرتبطة بميزة تحديد المصدر للإجابة عن السؤال (AQA) على مستند أو قاعدة بيانات أو مجموعة من المقاطع. يعرض نموذج AQA إجابات عن الأسئلة المستندة إلى المصادر المقدَّمة، بالإضافة إلى تقدير الاحتمالية التي يمكن الإجابة عنها.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/aqa |
أنواع البيانات المتوافقة |
الإدخال نص النتيجة نص |
اللغة المتاحة | الإنجليزية |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 7,168 الحد الأقصى لرموز الإخراج 1,024 |
[**] | حدود السرعة1,500 طلب في الدقيقة |
إعدادات أمان | وقابلة للتعديلمتاح |
آخر تعديل | كانون الأول (ديسمبر) 2023 |
اطّلِع على الأمثلة لاستكشاف إمكانات نماذج التفاصيل هذه.
[*] يعادل الرمز المميّز 4 أحرف تقريبًا في نماذج Gemini. 100 رمز تُمثّل ما يقرب من 60 إلى 80 كلمة باللغة الإنجليزية.
[**] عدد الطلبات في الدقيقة (RPM):
الرموز المميّزة في الدقيقة (TPM):
الطلبات في اليوم (RPD):
الرموز المميّزة في اليوم (TPD):
بسبب القيود المفروضة على السعة، لا يمكن ضمان عدم تجاوز الحدود القصوى المحدّدة للمعدل.
أنماط أسماء إصدارات الطراز
تتوفّر نماذج Gemini في إصدارَي الإصدار التجريبي أو الإصدار الثابت. في الرمز البرمجي، يمكنك استخدام أحد تنسيقات أسماء الطُرز التالية لتحديد طراز والإصدار اللذين تريد استخدامهما.
أحدث: يشير إلى أحدث إصدار من النموذج لجيل ونوع محدّدَين. يتم تعديل النموذج الأساسي بانتظام وقد يكون إصدارًا تجريبيًا. يجب استخدام هذا الاسم المعرِّف فقط مع التطبيقات والنماذج الأولية للاختبار الاستكشافي.
لتحديد أحدث إصدار، استخدِم النمط التالي:
<model>-<generation>-<variation>-latest
. على سبيل المثال،gemini-1.0-pro-latest
.أحدث إصدار ثابت: يشير إلى أحدث إصدار ثابت تم إصداره لجيل الموديل وطرازه المحدّدَين.
لتحديد أحدث إصدار ثابت، استخدِم النمط التالي:
<model>-<generation>-<variation>
. مثلاً:gemini-1.0-pro
مستقر: يشير إلى نموذج ثابت معيّن. لا تتغيّر النماذج الثابتة. يجب أن تستخدم معظم التطبيقات العلنية طرازًا ثابتًا محدّدًا.
لتحديد إصدار ثابت، استخدِم النمط التالي:
<model>-<generation>-<variation>-<version>
. على سبيل المثال،gemini-1.0-pro-001
.تجريبي: يشير إلى نموذج تجريبي متوفّر في "المعاينة"، كما هو محدّد في الأحكام، ما يعني أنّه غير مخصّص للاستخدام في مرحلة الإنتاج. نطرح نماذج تجريبية لجمع الملاحظات والآراء، وتقديم آخر التحديثات للمطوّرين بشكل سريع، وإبراز وتيرة الابتكار في Google. وتساعدنا المعلومات التي نكتسبها من عمليات الإطلاق التجريبية في تحديد كيفية طرح النماذج على نطاق أوسع. يمكن استبدال نموذج تجريبي بنموذج آخر بدون إرسال إشعار مسبق. لا نضمن أن يصبح النموذج التجريبي نموذجًا ثابتًا في المستقبل.
لتحديد إصدار تجريبي، استخدِم النمط التالي:
<model>-<generation>-<variation>-<version>
. على سبيل المثال،gemini-1.5-pro-exp-0827
.
اللغات المتاحة
تم تدريب نماذج Gemini للعمل باللغات التالية:
- العربية (
ar
) - البنغالية (
bn
) - البلغارية (
bg
) - الصينية المبسّطة والتقليدية (
zh
) - الكرواتية (
hr
) - التشيكية (
cs
) - الدانمركية (
da
) - الهولندية (
nl
) - الإنجليزية (
en
) - الإستونية (
et
) - الفنلندية (
fi
) - الفرنسية (
fr
) - الألمانية (
de
) - اليونانية (
el
) - العبرية (
iw
) - الهندية (
hi
) - المجرية (
hu
) - الإندونيسية (
id
) - الإيطالية (
it
) - اليابانية (
ja
) - الكورية (
ko
) - اللاتفية (
lv
) - الليتوانية (
lt
) - النرويجية (
no
) - البولندية (
pl
) - البرتغالية (
pt
) - الرومانية (
ro
) - الروسية (
ru
) - الصربية (
sr
) - السلوفاكية (
sk
) - السلوفينية (
sl
) - الإسبانية (
es
) - السواحيلية (
sw
) - السويدية (
sv
) - التايلاندية (
th
) - التركية (
tr
) - الأوكرانية (
uk
) - الفيتنامية (
vi
)