نماذج Gemini

متغيرات الطراز

تقدّم Gemini API نماذج مختلفة تم تحسينها لاستخدامات معيّنة الحالات. في ما يلي نظرة عامة مختصرة على خيارات Gemini المتاحة:

صيغة النموذج الإدخالات الناتج محسَّن من أجل
Gemini 1.5 Flash
gemini-1.5-flash
الصوت والصور والفيديوهات والنصوص النص أداء سريع ومتعدّد الاستخدامات في مجموعة متنوّعة من المهام
Gemini 1.5 Pro
gemini-1.5-pro
الصوت والصور والفيديوهات والنصوص النص مهام الاستنتاج المعقدة مثل إنشاء التعليمات البرمجية والنصوص تحرير النصوص وحل المشاكل واستخراج البيانات وإنشائها
Gemini 1.0 Pro
gemini-1.0-pro
النص النص مهام اللغة الطبيعية والمحادثة النصية والرموز البرمجية متعددة الأدوار والرموز البرمجية الجيل
تضمين النص
text-embedding-004
النص تضمينات النص قياس مدى صلة السلاسل النصية
AQA
aqa
النص النص توفير إجابات تستند إلى المصدر عن الأسئلة

يوضّح الجدول التالي سمات نماذج Gemini التالية: شائعة بين جميع متغيرات الطُرز:

السمة الوصف
بيانات التدريب والموعد النهائي لطلب Gemini هو تشرين الثاني (نوفمبر) 2023. وستبقى المعلومات عن الأحداث التي تلي هذه الفترة محدودة.
اللغات المتاحة الاطّلاع على اللغات المتاحة
مَعلمات النموذج القابل للضبط
  • أعلى p
  • أعلى ك
  • درجة الحرارة
  • إيقاف التسلسل
  • الحدّ الأقصى لطول الإخراج
  • عدد المرشحين للرد

اطّلِع على معلَمات النموذج. من القسم اطّلِع على دليل النماذج التوليدية للحصول على معلومات عن كلّ من هذه المَعلمات.

فلاش الإصدار 1.5 من Gemini

Gemini 1.5 Flash هو نموذج سريع ومتعدد الوسائط متعدد الوسائط للتوسّع مهام متنوعة.

التجربة في AI Studio

تفاصيل الطراز

الموقع الوصف
رمز الطراز models/gemini-1.5-flash
أنواع البيانات المتوافقة

مصادر الإدخال

الصوت والصور والفيديو والنص

الناتج

النص

حدود الرموز المميزة[*]

الحد الأقصى لإدخال الرموز المميّزة

1,048,576

حد الرمز المميّز للإخراج

8,192

مواصفات الصوت/المرئي

الحد الأقصى لعدد الصور في كل طلب

3,600

الحد الأقصى لمدة الفيديو

ساعة واحدة

الحد الأقصى لطول الصوت

9.5 ساعات تقريبًا

حدود السعر[**]
مجانًا:
  • 15 لفة في الدقيقة
  • مليون وحدة النظام الأساسي الموثوقة (TPM)
  • 1,500 RPD
Pay-as-you-go:
  • 1,000 لفة في الدقيقة
  • 4 مليون وحدة النظام الأساسي الموثوقة (TPM)
Capabilities

تعليمات النظام

متاح

وضع JSON

متاح

مخطّط JSON

متاح

إعدادات أمان قابلة للتعديل

متاح

التخزين المؤقت

متاح

الضبط

متاح

استدعاء الدالة

متاح

إعداد استدعاء الدالة

متاح

تنفيذ الرمز

متاح

الإصدارات
  • الأحدث: gemini-1.5-flash-latest
  • آخر سعر ثابت: gemini-1.5-flash
  • الإصدار الثابت: gemini-1.5-flash-001
  • ميزة تجريبية:
    • gemini-1.5-flash-exp-0827
    • gemini-1.5-flash-8b-exp-0827
آخر تحديث مايو 2024

Gemini 1.5 Pro

Gemini 1.5 Pro هو نموذج متوسط الحجم متعدد الوسائط تم تحسينه لمجموعة واسعة من المهام الاستنتاجية. 1.5 Pro يمكنه معالجة كميات كبيرة من البيانات مرة واحدة، بما في ذلك ساعتين من الفيديو، و19 ساعة من الصوت، وقواعد رموز مع 60,000 سطر من الرموز أو 2,000 صفحة من النص.

التجربة في AI Studio

تفاصيل الطراز

الموقع الوصف
رمز الطراز models/gemini-1.5-pro
أنواع البيانات المتوافقة

مصادر الإدخال

الصوت والصور والفيديو والنص

الناتج

النص

حدود الرموز المميزة[*]

الحد الأقصى لإدخال الرموز المميّزة

2,097,152

حد الرمز المميّز للإخراج

8,192

مواصفات الصوت/المرئي

الحد الأقصى لعدد الصور في كل طلب

7,200

الحد الأقصى لمدة الفيديو

ساعتان

الحد الأقصى لطول الصوت

19 ساعة تقريبًا

حدود السعر[**]
مجانًا:
  • 2 لفة في الدقيقة
  • 32,000 وحدة في الدقيقة
  • 50 RPD
Pay-as-you-go:
  • 360 لفة في الدقيقة
  • 4 مليون وحدة النظام الأساسي الموثوقة (TPM)
Capabilities

تعليمات النظام

متاح

وضع JSON

متاح

مخطّط JSON

متاح

إعدادات أمان قابلة للتعديل

متاح

التخزين المؤقت

متاح

الضبط

غير متاح

استدعاء الدالة

متاح

إعداد استدعاء الدالة

متاح

تنفيذ الرمز

متاح

الإصدارات
  • الأحدث: gemini-1.5-pro-latest
  • آخر سعر ثابت: gemini-1.5-pro
  • الإصدار الثابت: gemini-1.5-pro-001
  • ميزة تجريبية:
    • gemini-1.5-pro-exp-0801
    • gemini-1.5-pro-exp-0827
آخر تحديث مايو 2024

Gemini 1.0 Pro

Gemini 1.0 Pro هو نموذج لمعالجة اللغات الطبيعية (NLP) يعالج مهام مثل إرسال النصوص المتعدّدة الأدوار ودردشة الرموز وإنشاء التعليمات البرمجية.

التجربة في AI Studio

تفاصيل الطراز

الموقع الوصف
رمز الطراز models/gemini-1.0-pro
أنواع البيانات المتوافقة

الإدخال

النص

الناتج

النص

حدود السعر[**]
مجانًا:
  • 15 لفة في الدقيقة
  • 32,000 وحدة في الدقيقة
  • 1,500 RPD
Pay-as-you-go:
  • 360 لفة في الدقيقة
  • 120,000 وحدة في الدقيقة
  • 30,000 RPD
Capabilities

تعليمات النظام

غير متاح

وضع JSON

غير متاح

مخطّط JSON

غير متاح

إعدادات أمان قابلة للتعديل

متاح

التخزين المؤقت

غير متاح

الضبط

متاح

استدعاء الدالة

متاح

إعداد استدعاء الدالة

غير متاح

تنفيذ الرمز

غير متاح

الإصدارات
  • الأحدث: gemini-1.0-pro-latest
  • آخر سعر ثابت: gemini-1.0-pro
  • الإصدار الثابت: gemini-1.0-pro-001
آخر تحديث شباط (فبراير) 2024

تضمين النص وتضمينه

تضمين النص

تُستخدم تضمينات النص لقياس مدى صلة السلاسل، وتُستخدم على نطاق واسع في والعديد من تطبيقات الذكاء الاصطناعي.

يحقق text-embedding-004 أداء استرجاع أقوى ويتفوق في أدائه على النماذج الحالية بأبعاد مشابهة على مقاييس أداء تضمين MTEB القياسي.

تفاصيل الطراز
الموقع الوصف
رمز الطراز

Gemini API

models/text-embedding-004

أنواع البيانات المتوافقة

الإدخال

النص

الناتج

تضمينات النص

حدود الرموز المميزة[*]

الحد الأقصى لإدخال الرموز المميّزة

2,048

حجم بُعد الإخراج

768

حدود السعر[**] 1,500 طلب في الدقيقة
إعدادات أمان قابلة للتعديل غير متاح
آخر تحديث أبريل 2024

التضمين

يمكنك استخدام نموذج التضمين لإنشاء تضمينات النص في إدخال نص.

تم تحسين نموذج التضمين لإنشاء عمليات تضمين بحجم 768. للنصوص التي تصل إلى 2,048 رمزًا مميزًا.

تضمين تفاصيل النموذج
الموقع الوصف
رمز الطراز models/embedding-001
أنواع البيانات المتوافقة

الإدخال

النص

الناتج

تضمينات النص

حدود الرموز المميزة[*]

الحد الأقصى لإدخال الرموز المميّزة

2,048

حجم بُعد الإخراج

768

حدود السعر[**] 1,500 طلب في الدقيقة
إعدادات أمان قابلة للتعديل غير متاح
آخر تحديث كانون الأول (ديسمبر) 2023

AQA

يمكنك استخدام نموذج AQA لإجراء الإجابة عن أسئلة تحديد المصدر (AQA) - المهام المتعلقة بمستند أو مجموعة من الفقرات. مؤشر جودة الهواء إجابات عن الأسئلة القائمة على المصادر المتوفرة إلى جانب تقدير الاحتمالية القابلة للإجابة.

تفاصيل الطراز

الموقع الوصف
رمز الطراز models/aqa
أنواع البيانات المتوافقة

الإدخال

النص

الناتج

النص

اللغات المتاحة الإنجليزية
حدود الرموز المميزة[*]

الحد الأقصى لإدخال الرموز المميّزة

7,168

حد الرمز المميّز للإخراج

1,024

حدود السعر[**] 1,500 طلب في الدقيقة
إعدادات أمان قابلة للتعديل متاح
آخر تحديث كانون الأول (ديسمبر) 2023

اطّلِع على الأمثلة لاستكشاف إمكانات هذه النماذج. المختلفة.

[*] يعادل الرمز المميّز 4 أحرف تقريبًا في نماذج Gemini. 100 رمز مميّز حوالي 60-80 كلمة إنجليزية.

[**] RPM: عدد الطلبات في الدقيقة
TPM: عدد الرموز المميّزة في الدقيقة
RPD: الطلبات في اليوم
TPD: الرموز المميّزة في اليوم

بسبب القيود المفروضة على السعة، لا يتم ضبط الحدود القصوى لمعدّل الاستخدام. مضمون.

أنماط اسم إصدار النموذج

تتوفّر نماذج Gemini إما في إصدار المعاينة أو الثابت. في يمكنك استخدام أحد تنسيقات أسماء النماذج التالية لتحديد النموذج والإصدار الذي تريد استخدامه.

  • الأحدث: يشير هذا المصطلح إلى أحدث إصدار من النموذج لنموذج الإنشاء والتباين. يتم تحديث النموذج الأساسي بانتظام وقد إصدار معاينة. يجب فقط تطبيقات الاختبار الاستكشافي والنماذج الأولية استخدام هذا الاسم المستعار.

    لتحديد أحدث إصدار، استخدِم النمط التالي: <model>-<generation>-<variation>-latest على سبيل المثال: gemini-1.0-pro-latest

  • أحدث إصدار ثابت: يشير إلى أحدث إصدار ثابت تم طرحه إنشاء نموذج محدد وتنوعه.

    لتحديد أحدث إصدار ثابت، استخدِم النمط التالي: <model>-<generation>-<variation> مثلاً: gemini-1.0-pro

  • ثابت: يشير إلى نموذج ثابت معيَّن. لا تتغير النماذج الثابتة. يجب أن تستخدم معظم تطبيقات الإنتاج طرازًا ثابتًا ومحددًا.

    لتحديد إصدار ثابت، استخدم النمط التالي: <model>-<generation>-<variation>-<version> على سبيل المثال: gemini-1.0-pro-001

  • تجريبية: تشير إلى نموذج تجريبي متاح في المعاينة. كما هو موضح في البنود. مما يعني أنه ليس للاستخدام في الإنتاج. طرحنا نماذج تجريبية لجمع الملاحظات، اعرض آخر التحديثات في أيدي المطوّرين بسرعة، ويسلط الضوء على وتيرة الابتكار في Google. المزايا الذي نتعلمه من عمليات الإطلاق التجريبية يوضح كيف نصدر نماذج أكثر على نطاق واسع. يمكن تبديل نموذج تجريبي بآخر بدون نموذج . نحن لا نضمن أن يصبح أي نموذج تجريبي ونموذج ثابت في المستقبل.

    لتحديد إصدار تجريبي، استخدم النمط التالي: <model>-<generation>-<variation>-<version> على سبيل المثال: gemini-1.5-pro-exp-0801

اللغات المتاحة

يتم تدريب نماذج Gemini على العمل باللغات التالية:

  • العربية (ar)
  • البنغالية (bn)
  • البلغارية (bg)
  • الصينية المبسّطة والتقليدية (zh)
  • الكرواتية (hr)
  • التشيكية (cs)
  • الدانمركية (da)
  • الهولندية (nl)
  • الإنجليزية (en)
  • الإستونية (et)
  • الفنلندية (fi)
  • الفرنسية (fr)
  • الألمانية (de)
  • اليونانية (el)
  • العبرية (iw)
  • الهندية (hi)
  • الهنغارية (hu)
  • الإندونيسية (id)
  • الإيطالية (it)
  • اليابانية (ja)
  • الكورية (ko)
  • اللاتفية (lv)
  • الليتوانية (lt)
  • النرويجية (no)
  • البولندية (pl)
  • البرتغالية (pt)
  • الرومانية (ro)
  • الروسية (ru)
  • الصربية (sr)
  • السلوفاكية (sk)
  • السلوفينية (sl)
  • الإسبانية (es)
  • السواحيلية (sw)
  • السويدية (sv)
  • التايلاندية (th)
  • التركية (tr)
  • الأوكرانية (uk)
  • الفيتنامية (vi)