متغيرات الطراز
تقدّم Gemini API نماذج مختلفة تم تحسينها لاستخدامات معيّنة الحالات. في ما يلي نظرة عامة مختصرة على خيارات Gemini المتاحة:
صيغة النموذج | الإدخالات | الناتج | محسَّن من أجل |
---|---|---|---|
Gemini 1.5 Flash
gemini-1.5-flash |
الصوت والصور والفيديوهات والنصوص | النص | أداء سريع ومتعدّد الاستخدامات في مجموعة متنوّعة من المهام |
Gemini 1.5 Pro
gemini-1.5-pro |
الصوت والصور والفيديوهات والنصوص | النص | مهام الاستنتاج المعقدة مثل إنشاء التعليمات البرمجية والنصوص تحرير النصوص وحل المشاكل واستخراج البيانات وإنشائها |
Gemini 1.0 Pro
gemini-1.0-pro |
النص | النص | مهام اللغة الطبيعية والمحادثة النصية والرموز البرمجية متعددة الأدوار والرموز البرمجية الجيل |
تضمين النص
text-embedding-004 |
النص | تضمينات النص | قياس مدى صلة السلاسل النصية |
AQA
aqa |
النص | النص | توفير إجابات تستند إلى المصدر عن الأسئلة |
يوضّح الجدول التالي سمات نماذج Gemini التالية: شائعة بين جميع متغيرات الطُرز:
السمة | الوصف |
---|---|
بيانات التدريب | والموعد النهائي لطلب Gemini هو تشرين الثاني (نوفمبر) 2023. وستبقى المعلومات عن الأحداث التي تلي هذه الفترة محدودة. |
اللغات المتاحة | الاطّلاع على اللغات المتاحة |
مَعلمات النموذج القابل للضبط |
|
اطّلِع على معلَمات النموذج. من القسم اطّلِع على دليل النماذج التوليدية للحصول على معلومات عن كلّ من هذه المَعلمات.
فلاش الإصدار 1.5 من Gemini
Gemini 1.5 Flash هو نموذج سريع ومتعدد الوسائط متعدد الوسائط للتوسّع مهام متنوعة.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-flash |
أنواع البيانات المتوافقة |
مصادر الإدخال الصوت والصور والفيديو والنص الناتج النص |
[*] | حدود الرموز المميزة
الحد الأقصى لإدخال الرموز المميّزة 1,048,576 حد الرمز المميّز للإخراج 8,192 |
مواصفات الصوت/المرئي |
الحد الأقصى لعدد الصور في كل طلب 3,600 الحد الأقصى لمدة الفيديو ساعة واحدة الحد الأقصى لطول الصوت 9.5 ساعات تقريبًا |
[**] | حدود السعر
|
Capabilities |
تعليمات النظام متاح وضع JSON متاح مخطّط JSON متاح إعدادات أمان قابلة للتعديل متاح التخزين المؤقت متاح الضبط متاح استدعاء الدالة متاح إعداد استدعاء الدالة متاح تنفيذ الرمز متاح |
الإصدارات |
|
آخر تحديث | مايو 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro هو نموذج متوسط الحجم متعدد الوسائط تم تحسينه لمجموعة واسعة من المهام الاستنتاجية. 1.5 Pro يمكنه معالجة كميات كبيرة من البيانات مرة واحدة، بما في ذلك ساعتين من الفيديو، و19 ساعة من الصوت، وقواعد رموز مع 60,000 سطر من الرموز أو 2,000 صفحة من النص.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-pro |
أنواع البيانات المتوافقة |
مصادر الإدخال الصوت والصور والفيديو والنص الناتج النص |
[*] | حدود الرموز المميزة
الحد الأقصى لإدخال الرموز المميّزة 2,097,152 حد الرمز المميّز للإخراج 8,192 |
مواصفات الصوت/المرئي |
الحد الأقصى لعدد الصور في كل طلب 7,200 الحد الأقصى لمدة الفيديو ساعتان الحد الأقصى لطول الصوت 19 ساعة تقريبًا |
[**] | حدود السعر
|
Capabilities |
تعليمات النظام متاح وضع JSON متاح مخطّط JSON متاح إعدادات أمان قابلة للتعديل متاح التخزين المؤقت متاح الضبط غير متاح استدعاء الدالة متاح إعداد استدعاء الدالة متاح تنفيذ الرمز متاح |
الإصدارات |
|
آخر تحديث | مايو 2024 |
Gemini 1.0 Pro
Gemini 1.0 Pro هو نموذج لمعالجة اللغات الطبيعية (NLP) يعالج مهام مثل إرسال النصوص المتعدّدة الأدوار ودردشة الرموز وإنشاء التعليمات البرمجية.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.0-pro |
أنواع البيانات المتوافقة |
الإدخال النص الناتج النص |
[**] | حدود السعر
|
Capabilities |
تعليمات النظام غير متاح وضع JSON غير متاح مخطّط JSON غير متاح إعدادات أمان قابلة للتعديل متاح التخزين المؤقت غير متاح الضبط متاح استدعاء الدالة متاح إعداد استدعاء الدالة غير متاح تنفيذ الرمز غير متاح |
الإصدارات |
|
آخر تحديث | شباط (فبراير) 2024 |
تضمين النص وتضمينه
تضمين النص
تُستخدم تضمينات النص لقياس مدى صلة السلاسل، وتُستخدم على نطاق واسع في والعديد من تطبيقات الذكاء الاصطناعي.
يحقق text-embedding-004
أداء استرجاع أقوى ويتفوق في أدائه على النماذج الحالية
بأبعاد مشابهة على مقاييس أداء تضمين MTEB القياسي.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز |
Gemini API
|
أنواع البيانات المتوافقة |
الإدخال النص الناتج تضمينات النص |
[*] | حدود الرموز المميزة
الحد الأقصى لإدخال الرموز المميّزة 2,048 حجم بُعد الإخراج 768 |
[**] | حدود السعر1,500 طلب في الدقيقة |
إعدادات أمان قابلة للتعديل | غير متاح |
آخر تحديث | أبريل 2024 |
التضمين
يمكنك استخدام نموذج التضمين لإنشاء تضمينات النص في إدخال نص.
تم تحسين نموذج التضمين لإنشاء عمليات تضمين بحجم 768. للنصوص التي تصل إلى 2,048 رمزًا مميزًا.
تضمين تفاصيل النموذج
الموقع | الوصف |
---|---|
رمز الطراز |
models/embedding-001
|
أنواع البيانات المتوافقة |
الإدخال النص الناتج تضمينات النص |
[*] | حدود الرموز المميزة
الحد الأقصى لإدخال الرموز المميّزة 2,048 حجم بُعد الإخراج 768 |
[**] | حدود السعر1,500 طلب في الدقيقة |
إعدادات أمان قابلة للتعديل | غير متاح |
آخر تحديث | كانون الأول (ديسمبر) 2023 |
AQA
يمكنك استخدام نموذج AQA لإجراء الإجابة عن أسئلة تحديد المصدر (AQA) - المهام المتعلقة بمستند أو مجموعة من الفقرات. مؤشر جودة الهواء إجابات عن الأسئلة القائمة على المصادر المتوفرة إلى جانب تقدير الاحتمالية القابلة للإجابة.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/aqa |
أنواع البيانات المتوافقة |
الإدخال النص الناتج النص |
اللغات المتاحة | الإنجليزية |
[*] | حدود الرموز المميزة
الحد الأقصى لإدخال الرموز المميّزة 7,168 حد الرمز المميّز للإخراج 1,024 |
[**] | حدود السعر1,500 طلب في الدقيقة |
إعدادات أمان قابلة للتعديل | متاح |
آخر تحديث | كانون الأول (ديسمبر) 2023 |
اطّلِع على الأمثلة لاستكشاف إمكانات هذه النماذج. المختلفة.
[*] يعادل الرمز المميّز 4 أحرف تقريبًا في نماذج Gemini. 100 رمز مميّز حوالي 60-80 كلمة إنجليزية.
[**] RPM: عدد الطلبات في الدقيقة
TPM: عدد الرموز المميّزة في الدقيقة
RPD: الطلبات في اليوم
TPD: الرموز المميّزة في اليوم
بسبب القيود المفروضة على السعة، لا يتم ضبط الحدود القصوى لمعدّل الاستخدام.
مضمون.
أنماط اسم إصدار النموذج
تتوفّر نماذج Gemini إما في إصدار المعاينة أو الثابت. في يمكنك استخدام أحد تنسيقات أسماء النماذج التالية لتحديد النموذج والإصدار الذي تريد استخدامه.
الأحدث: يشير هذا المصطلح إلى أحدث إصدار من النموذج لنموذج الإنشاء والتباين. يتم تحديث النموذج الأساسي بانتظام وقد إصدار معاينة. يجب فقط تطبيقات الاختبار الاستكشافي والنماذج الأولية استخدام هذا الاسم المستعار.
لتحديد أحدث إصدار، استخدِم النمط التالي:
<model>-<generation>-<variation>-latest
على سبيل المثال:gemini-1.0-pro-latest
أحدث إصدار ثابت: يشير إلى أحدث إصدار ثابت تم طرحه إنشاء نموذج محدد وتنوعه.
لتحديد أحدث إصدار ثابت، استخدِم النمط التالي:
<model>-<generation>-<variation>
مثلاً:gemini-1.0-pro
ثابت: يشير إلى نموذج ثابت معيَّن. لا تتغير النماذج الثابتة. يجب أن تستخدم معظم تطبيقات الإنتاج طرازًا ثابتًا ومحددًا.
لتحديد إصدار ثابت، استخدم النمط التالي:
<model>-<generation>-<variation>-<version>
على سبيل المثال:gemini-1.0-pro-001
تجريبية: تشير إلى نموذج تجريبي متاح في المعاينة. كما هو موضح في البنود. مما يعني أنه ليس للاستخدام في الإنتاج. طرحنا نماذج تجريبية لجمع الملاحظات، اعرض آخر التحديثات في أيدي المطوّرين بسرعة، ويسلط الضوء على وتيرة الابتكار في Google. المزايا الذي نتعلمه من عمليات الإطلاق التجريبية يوضح كيف نصدر نماذج أكثر على نطاق واسع. يمكن تبديل نموذج تجريبي بآخر بدون نموذج . نحن لا نضمن أن يصبح أي نموذج تجريبي ونموذج ثابت في المستقبل.
لتحديد إصدار تجريبي، استخدم النمط التالي:
<model>-<generation>-<variation>-<version>
على سبيل المثال:gemini-1.5-pro-exp-0801
اللغات المتاحة
يتم تدريب نماذج Gemini على العمل باللغات التالية:
- العربية (
ar
) - البنغالية (
bn
) - البلغارية (
bg
) - الصينية المبسّطة والتقليدية (
zh
) - الكرواتية (
hr
) - التشيكية (
cs
) - الدانمركية (
da
) - الهولندية (
nl
) - الإنجليزية (
en
) - الإستونية (
et
) - الفنلندية (
fi
) - الفرنسية (
fr
) - الألمانية (
de
) - اليونانية (
el
) - العبرية (
iw
) - الهندية (
hi
) - الهنغارية (
hu
) - الإندونيسية (
id
) - الإيطالية (
it
) - اليابانية (
ja
) - الكورية (
ko
) - اللاتفية (
lv
) - الليتوانية (
lt
) - النرويجية (
no
) - البولندية (
pl
) - البرتغالية (
pt
) - الرومانية (
ro
) - الروسية (
ru
) - الصربية (
sr
) - السلوفاكية (
sk
) - السلوفينية (
sl
) - الإسبانية (
es
) - السواحيلية (
sw
) - السويدية (
sv
) - التايلاندية (
th
) - التركية (
tr
) - الأوكرانية (
uk
) - الفيتنامية (
vi
)