فلاش 2.0
أحدث نموذج متعدد الوسائط لدينا، مع ميزات الجيل التالي وقدرات محسَّنة
- إدخال محتوى صوتي وصور وفيديو ونصوص، والحصول على ردود نصية وصور وصوتية
- تتضمّن تفاعلات محادثية تتم الاستجابة لها بسرعة باستخدام واجهة برمجة التطبيقات Multimodal Live API
خيارات المنتج
توفّر Gemini API نماذج مختلفة محسّنة لحالات استخدام محدّدة. في ما يلي نظرة عامة موجزة على أنواع Gemini المتاحة:
خيار المنتج | الإدخالات | الناتج | محسَّنة لـ |
---|---|---|---|
فلاش Gemini 2.0
gemini-2.0-flash-exp |
الصوت والصور والفيديوهات والنصوص | النصوص والصور (قريبًا) والملفات الصوتية (قريبًا) | ميزات الجيل التالي والسرعة وإنشاء المحتوى باستخدام وسائط متعددة لمجموعة متنوعة من المهام |
Gemini 1.5 Flash
gemini-1.5-flash |
الصوت والصور والفيديوهات والنصوص | نص | أداء سريع ومتعدد الاستخدامات في مجموعة متنوعة من المهام |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
الصوت والصور والفيديوهات والنصوص | نص | المهام ذات الحجم الكبير والذكاء المنخفض |
Gemini 1.5 Pro
gemini-1.5-pro |
الصوت والصور والفيديوهات والنصوص | نص | مهام التفكير المعقدة التي تتطلّب ذكاءً أكبر |
(سيتم إيقافه نهائيًا في 15 شباط (فبراير) 2025) Gemini 1.0 Pro
gemini-1.0-pro |
نص | نص | المهام المستندة إلى اللغة الطبيعية، والمحادثات النصية والرموز البرمجية المتعدّدة المقاطع، وإنشاء الرموز البرمجية |
تضمين النص
text-embedding-004 |
نص | عمليات تضمين النصوص | قياس مدى صلة سلاسل النصوص ببعضها |
AQA
aqa |
نص | نص | تقديم إجابات مستندة إلى مصادر موثوقة |
(تجريبي) Gemini 2.0 Flash
يقدّم الإصدار 2.0 Flash من Gemini ميزات وإمكانات محسّنة من الجيل التالي، بما في ذلك السرعة الفائقة واستخدام الأدوات الأصلية وإنشاء النماذج المتعدّدة وقدرة استيعاب مليون رمز مميّز يستند إلى السياق. مزيد من المعلومات حول صفحة النظرة العامة
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-2.0-flash-exp |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص النتيجة الملفات الصوتية (قريبًا) والصور (قريبًا) والنصوص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 1,048,576 الحد الأقصى لرموز الإخراج 8,192 |
[**] | حدود السرعة
|
النواتج المنظَّمة متاح التخزين المؤقت غير متاح الضبط غير متاح استدعاء الدالة متاح تنفيذ الرمز البرمجي متاح بحث متاح إنشاء الصور متاح استخدام الأدوات المدمجة متاح إنشاء الصوت متاح |
|
Versions |
|
آخر تعديل | ديسمبر 2024 |
Gemini 1.5 Flash
Gemini 1.5 Flash هو نموذج سريع ومتعدد الاستخدامات لأداء مجموعة متنوعة من المهام بكفاءة.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-flash |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص النتيجة نص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 1,048,576 الحد الأقصى لرموز الإخراج 8,192 |
| المواصفات الصوتية/المرئية
الحد الأقصى لعدد الصور لكل طلب 3,600 الحد الأقصى لمدة الفيديو ساعة واحدة الحد الأقصى لطول الملف الصوتي 9.5 ساعة تقريبًا |
[**] | حدود السرعة
|
تعليمات النظام متاح وضع JSON متاح مخطّط JSON متاح إعدادات السلامة القابلة للتعديل متاح التخزين المؤقت متاح الضبط متاح استدعاء الدالة متاح تنفيذ الرمز البرمجي متاح البث في الاتجاهين غير متاح |
|
Versions |
|
آخر تعديل | سبتمبر 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B هو نموذج صغير مصمّم للمهام الأقل ذكاءً.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-flash-8b |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص النتيجة نص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 1,048,576 الحد الأقصى لرموز الإخراج 8,192 |
| المواصفات الصوتية/المرئية
الحد الأقصى لعدد الصور لكل طلب 3,600 الحد الأقصى لمدة الفيديو ساعة واحدة الحد الأقصى لطول الملف الصوتي 9.5 ساعة تقريبًا |
[**] | حدود السرعة
|
تعليمات النظام متاح وضع JSON متاح مخطّط JSON متاح إعدادات السلامة القابلة للتعديل متاح التخزين المؤقت متاح الضبط متاح استدعاء الدالة متاح تنفيذ الرمز البرمجي متاح البث في الاتجاهين غير متاح |
|
Versions |
|
آخر تعديل | أكتوبر 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro هو نموذج متوسط الحجم متعدد الوسائط تم تحسينه لأداء مجموعة كبيرة من مهام الاستدلال. يمكن لإصدار 1.5 Pro معالجة كميات كبيرة من البيانات في آنٍ واحد، بما في ذلك ساعتان من الفيديوهات أو 19 ساعة من المحتوى الصوتي أو قواعد الرموز البرمجية التي تضم 60,000 سطر من الرموز البرمجية أو 2,000 صفحة من النصوص.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-pro |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص النتيجة نص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 2,097,152 الحد الأقصى لرموز الإخراج 8,192 |
| المواصفات الصوتية/المرئية
الحد الأقصى لعدد الصور لكل طلب 7,200 الحد الأقصى لمدة الفيديو ساعتان الحد الأقصى لطول الملف الصوتي 19 ساعة تقريبًا |
[**] | حدود السرعة
|
تعليمات النظام متاح وضع JSON متاح مخطّط JSON متاح إعدادات السلامة القابلة للتعديل متاح التخزين المؤقت متاح الضبط غير متاح استدعاء الدالة متاح تنفيذ الرمز البرمجي متاح البث في الاتجاهين غير متاح |
|
Versions |
|
آخر تعديل | سبتمبر 2024 |
(تم إيقافه نهائيًا) Gemini 1.0 Pro
Gemini 1.0 Pro هو نموذج معالجة لغة طبيعية يعالج مهامًا مثل المحادثات المتعدّدة الجولات التي تتضمّن نصًا و رمزًا برمجيًا وإنشاء رموز برمجية.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.0-pro |
أنواع البيانات المتوافقة |
الإدخال نص النتيجة نص |
[**] | حدود السرعة
|
تعليمات النظام غير متاح وضع JSON غير متاح مخطّط JSON غير متاح إعدادات السلامة القابلة للتعديل متاح التخزين المؤقت غير متاح الضبط متاح استدعاء الدالة متاح إعدادات استدعاء الدوالّ غير متاح تنفيذ الرمز البرمجي غير متاح البث في الاتجاهين غير متاح |
|
Versions |
|
آخر تعديل | شباط (فبراير) 2024 |
تضمين النصوص
تضمين النص
تُستخدَم عمليات إدراج النصوص لقياس مدى صلة السلاسل ببعضها، وهي تُستخدَم على نطاق واسع في العديد من تطبيقات الذكاء الاصطناعي.
يحقّق text-embedding-004
أداءً أفضل في الاسترجاع ويتفوّق على النماذج الحالية
باستخدام سمات مشابهة، وذلك في مقاييس الأداء العادية لدمج MTEB.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز |
Gemini API
|
أنواع البيانات المتوافقة |
الإدخال نص النتيجة عمليات تضمين النصوص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 2,048 حجم سمة الإخراج 768 |
[**] | حدود السرعة1,500 طلب في الدقيقة |
إعدادات أمان | وقابلة للتعديلغير متاح |
آخر تعديل | أبريل 2024 |
التضمين
يمكنك استخدام نموذج "الترميز" لإنشاء نماذج نصية مدمجة لنص الإدخال.
تم تحسين نموذج "الترميز" لإنشاء نماذج ترميز تحتوي على 768 سمة للنص الذي يصل إلى 2,048 رمزًا.
تضمين تفاصيل النموذج
الموقع | الوصف |
---|---|
رمز الطراز |
models/embedding-001
|
أنواع البيانات المتوافقة |
الإدخال نص النتيجة عمليات تضمين النصوص |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 2,048 حجم سمة الإخراج 768 |
[**] | حدود السرعة1,500 طلب في الدقيقة |
إعدادات أمان | وقابلة للتعديلغير متاح |
آخر تعديل | كانون الأول (ديسمبر) 2023 |
AQA
يمكنك استخدام نموذج AQA لتنفيذ مهام مرتبطة بميزة تحديد المصدر للإجابة عن السؤال (AQA) على مستند أو قاعدة بيانات أو مجموعة من المقاطع. يعرض نموذج AQA إجابات عن الأسئلة المستندة إلى المصادر المقدَّمة، بالإضافة إلى تقدير الاحتمالية التي يمكن الإجابة عنها.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/aqa |
أنواع البيانات المتوافقة |
الإدخال نص النتيجة نص |
اللغة المتاحة | الإنجليزية |
[*] | حدود الرموز المميّزة
الحد الأقصى لعدد الرموز المميّزة التي يمكن إدخالها 7,168 الحد الأقصى لرموز الإخراج 1,024 |
[**] | حدود السرعة1,500 طلب في الدقيقة |
إعدادات أمان | وقابلة للتعديلمتاح |
آخر تعديل | كانون الأول (ديسمبر) 2023 |
اطّلِع على الأمثلة لاستكشاف إمكانات نماذج التفاصيل هذه.
[*] يعادل الرمز المميّز 4 أحرف تقريبًا في نماذج Gemini. 100 رمز تعادل ما يقرب من 60 إلى 80 كلمة باللغة الإنجليزية.
[**] عدد الطلبات في الدقيقة (RPM):
الرموز المميّزة في الدقيقة (TPM):
الطلبات في اليوم (RPD):
الرموز المميّزة في اليوم (TPD):
بسبب القيود المفروضة على السعة، لا يمكن ضمان عدم تجاوز الحدود القصوى المحدّدة للمعدل.
أنماط أسماء إصدارات الطراز
تتوفّر نماذج Gemini في إصدارَي الإصدار التجريبي أو الإصدار الثابت. في الرمز البرمجي، يمكنك استخدام أحد تنسيقات أسماء الطُرز التالية لتحديد طراز والإصدار اللذين تريد استخدامهما.
أحدث: يشير إلى أحدث إصدار من النموذج لجيل ونوع محدّدَين. يتم تعديل النموذج الأساسي بانتظام وقد يكون إصدارًا تجريبيًا. يجب استخدام هذا الاسم المعرِّف فقط مع النماذج الأولية وتطبيقات الاختبار الاستكشافي.
لتحديد أحدث إصدار، استخدِم النمط التالي:
<model>-<generation>-<variation>-latest
. على سبيل المثال،gemini-1.0-pro-latest
.أحدث إصدار ثابت: يشير إلى أحدث إصدار ثابت تم إصداره لجيل الموديل وطرازه المحدّدَين.
لتحديد أحدث إصدار ثابت، استخدِم النمط التالي:
<model>-<generation>-<variation>
. مثلاً:gemini-1.0-pro
مستقر: يشير إلى نموذج ثابت معيّن. لا تتغيّر النماذج الثابتة. يجب أن تستخدم معظم التطبيقات العلنية طرازًا ثابتًا محدّدًا.
لتحديد إصدار ثابت، استخدِم النمط التالي:
<model>-<generation>-<variation>-<version>
. على سبيل المثال،gemini-1.0-pro-001
.تجريبي: يشير إلى نموذج تجريبي متوفّر في "الإصدار التجريبي"، كما هو محدّد في البنود، ما يعني أنّه غير مخصّص للاستخدام في مرحلة الإنتاج. نطرح نماذج تجريبية لجمع الملاحظات والآراء، وتقديم آخر التحديثات للمطوّرين بشكل سريع، وإبراز وتيرة الابتكار في Google. وتساعدنا المعلومات التي نكتسبها من عمليات الإطلاق التجريبية في تحديد كيفية طرح النماذج على نطاق أوسع. يمكن استبدال نموذج تجريبي بنموذج آخر بدون إرسال إشعار مسبق. لا نضمن أن يصبح النموذج التجريبي نموذجًا ثابتًا في المستقبل.
لتحديد إصدار تجريبي، استخدِم النمط التالي:
<model>-<generation>-<variation>-<version>
. على سبيل المثال،gemini-exp-1121
.
اللغات المتاحة
تم تدريب نماذج Gemini للعمل باللغات التالية:
- العربية (
ar
) - البنغالية (
bn
) - البلغارية (
bg
) - الصينية المبسّطة والتقليدية (
zh
) - الكرواتية (
hr
) - التشيكية (
cs
) - الدانمركية (
da
) - الهولندية (
nl
) - الإنجليزية (
en
) - الإستونية (
et
) - الفنلندية (
fi
) - الفرنسية (
fr
) - الألمانية (
de
) - اليونانية (
el
) - العبرية (
iw
) - الهندية (
hi
) - المجرية (
hu
) - الإندونيسية (
id
) - الإيطالية (
it
) - اليابانية (
ja
) - الكورية (
ko
) - اللاتفية (
lv
) - الليتوانية (
lt
) - النرويجية (
no
) - البولندية (
pl
) - البرتغالية (
pt
) - الرومانية (
ro
) - الروسية (
ru
) - الصربية (
sr
) - السلوفاكية (
sk
) - السلوفينية (
sl
) - الإسبانية (
es
) - السواحيلية (
sw
) - السويدية (
sv
) - التايلاندية (
th
) - التركية (
tr
) - الأوكرانية (
uk
) - الفيتنامية (
vi
)