Gemini

متغيرات الطراز

تقدّم Gemini API نماذج مختلفة تم تحسينها لاستخدامات معيّنة الحالات. في ما يلي نظرة عامة مختصرة على خيارات Gemini المتاحة:

صيغة النموذج الإدخالات الناتج محسَّن من أجل
Gemini 1.5 Pro
gemini-1.5-pro
الصوت والصور والفيديوهات والنصوص النص مهام الاستنتاج المعقدة مثل إنشاء التعليمات البرمجية والنصوص تحرير النصوص وحل المشاكل واستخراج البيانات وإنشائها
Gemini 1.5 Flash
gemini-1.5-flash
الصوت والصور والفيديوهات والنصوص النص أداء سريع ومتعدّد الاستخدامات في مجموعة متنوّعة من المهام
Gemini 1.0 Pro
gemini-1.0-pro
النص النص مهام اللغة الطبيعية والمحادثة النصية والرموز البرمجية متعددة الأدوار والرموز البرمجية الجيل
(متوقّفة نهائيًا) Gemini 1.0 Pro Vision
gemini-pro-vision
الصور والفيديوهات والنصوص النص المهام المتعلّقة بالمرئيات، مثل إنشاء الصور الأوصاف أو تحديد الكائنات في الصور
تضمين النص
text-embedding-004
النص تضمينات النص قياس مدى صلة السلاسل النصية
جودة الهواء
aqa
النص النص توفير إجابات تستند إلى المصدر عن الأسئلة

يوضّح الجدول التالي سمات نماذج Gemini التالية: شائعة بين جميع متغيرات الطُرز:

السمة الوصف
بيانات التدريب والموعد النهائي لطلب Gemini هو تشرين الثاني (نوفمبر) 2023. وستبقى المعلومات عن الأحداث التي تلي هذه الفترة محدودة.
اللغات المتاحة الاطّلاع على اللغات المتاحة
مَعلمات النموذج القابل للضبط
  • أعلى p
  • أعلى ك
  • درجة الحرارة
  • إيقاف التسلسل
  • الحدّ الأقصى لطول الإخراج
  • عدد المرشحين للرد

اطّلِع على معلَمات النموذج. من القسم اطّلِع على دليل النماذج التوليدية للحصول على معلومات عن كلّ من هذه المَعلمات.

فلاش الإصدار 1.5 من Gemini

Gemini 1.5 Flash هو نموذج سريع ومتعدد الوسائط متعدد الوسائط للتوسّع مهام متنوعة.

التجربة في AI Studio

تفاصيل الطراز

الموقع الوصف
رمز الطراز models/gemini-1.5-flash
أنواع البيانات المتوافقة

مصادر الإدخال

الصوت والصور والفيديو والنص

الناتج

النص

حدود الرموز المميزة[*]

الحد الأقصى لإدخال الرموز المميّزة

1,048,576

حد الرمز المميّز للإخراج

8,192

مواصفات الصوت/المرئي

الحد الأقصى لعدد الصور في كل طلب

3,600

الحد الأقصى لمدة الفيديو

ساعة واحدة

الحد الأقصى لطول الصوت

9.5 ساعات تقريبًا

حدود السعر[**]
مجانًا:
  • 15 لفة في الدقيقة
  • مليون وحدة النظام الأساسي الموثوقة (TPM)
  • 1,500 RPD
Pay-as-you-go:
  • 1,000 لفة في الدقيقة
  • 2 مليون وحدة النظام الأساسي الموثوقة (TPM)
قدرات

تعليمات النظام

متاح

وضع JSON

متاح

مخطّط JSON

غير متاح

إعدادات أمان قابلة للتعديل

متاح

التخزين المؤقت

متاح

الضبط

غير متاح

استدعاء الدالة

متاح

إعداد استدعاء الدالة

متاح

تنفيذ الرمز

متاح

آخر تحديث مايو 2024

Gemini 1.5 Pro

Gemini 1.5 Pro هو نموذج متوسط الحجم متعدد الوسائط تم تحسينه لمجموعة واسعة من المهام الاستنتاجية. 1.5 Pro يمكنه معالجة كميات كبيرة من البيانات مرة واحدة، بما في ذلك ساعتين من الفيديو، و19 ساعة من الصوت، وقواعد رموز مع 60,000 سطر من الرموز أو 2,000 صفحة من النص.

التجربة في AI Studio

تفاصيل الطراز

الموقع الوصف
رمز الطراز models/gemini-1.5-pro
أنواع البيانات المتوافقة

مصادر الإدخال

الصوت والصور والفيديو والنص

الناتج

النص

حدود الرموز المميزة[*]

الحد الأقصى لإدخال الرموز المميّزة

2,097,152

حد الرمز المميّز للإخراج

8,192

مواصفات الصوت/المرئي

الحد الأقصى لعدد الصور في كل طلب

7,200

الحد الأقصى لمدة الفيديو

ساعتان

الحد الأقصى لطول الصوت

19 ساعة تقريبًا

حدود السعر[**]
مجانًا:
  • 2 لفة في الدقيقة
  • 32,000 وحدة في الدقيقة
  • 50 RPD
Pay-as-you-go:
  • 360 لفة في الدقيقة
  • 2 مليون وحدة النظام الأساسي الموثوقة (TPM)
  • 10,000 RPD
قدرات

تعليمات النظام

متاح

وضع JSON

متاح

مخطّط JSON

متاح

إعدادات أمان قابلة للتعديل

متاح

التخزين المؤقت

متاح

الضبط

غير متاح

استدعاء الدالة

متاح

إعداد استدعاء الدالة

متاح

تنفيذ الرمز

متاح

آخر تحديث مايو 2024

Gemini 1.0 Pro

Gemini 1.0 Pro هو نموذج لمعالجة اللغات الطبيعية (NLP) يعالج مهام مثل إرسال النصوص المتعدّدة الأدوار ودردشة الرموز وإنشاء التعليمات البرمجية.

التجربة في AI Studio

تفاصيل الطراز

الموقع الوصف
رمز الطراز models/gemini-1.0-pro
أنواع البيانات المتوافقة

الإدخال

النص

الناتج

النص

حدود السعر[**]
مجانًا:
  • 15 لفة في الدقيقة
  • 32,000 وحدة في الدقيقة
  • 1,500 RPD
Pay-as-you-go:
  • 360 لفة في الدقيقة
  • 120,000 وحدة في الدقيقة
  • 30,000 RPD
قدرات

تعليمات النظام

غير متاح

وضع JSON

غير متاح

مخطّط JSON

غير متاح

إعدادات أمان قابلة للتعديل

متاح

التخزين المؤقت

غير متاح

الضبط

متاح

استدعاء الدالة

متاح

إعداد استدعاء الدالة

غير متاح

تنفيذ الرمز

غير متاح

آخر تحديث شباط (فبراير) 2024

(متوقّف نهائيًا) Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision هو نموذج متعدد الوسائط محسَّن للأداء. التي يمكنها أداء المهام المتعلقة بالمرئيات. على سبيل المثال، يمكن لـ 1.0 Pro Vision وإنشاء أوصاف الصور وتحديد العناصر الموجودة في الصور وتوفير ومعلومات حول الأماكن أو العناصر الموجودة في الصور وغير ذلك.

تفاصيل الطراز

الموقع الوصف
رمز الطراز models/gemini-pro-vision
أنواع البيانات المتوافقة

مصادر الإدخال

الصور والفيديو والنصوص

الناتج

النص

حدود الرموز المميزة[*]

الحد الأقصى لإدخال الرموز المميّزة

12,288

حد الرمز المميّز للإخراج

4,096

مواصفات الصوت/المرئي

الحد الأقصى لمدة الفيديو

دقيقتان

حدود السعر[**] 60 طلبًا في الدقيقة
قدرات

تعليمات النظام

غير متاح

وضع JSON

غير متاح

مخطّط JSON

غير متاح

إعدادات أمان قابلة للتعديل

متاح

التخزين المؤقت

غير متاح

الضبط

غير متاح

استدعاء الدالة

متاح

إعداد استدعاء الدالة

غير متاح

تنفيذ الرمز

غير متاح

آخر تحديث كانون الأول (ديسمبر) 2023

تضمين النص وتضمينه

تضمين النص

يمكنك استخدام نموذج تضمين النص لإنشاء تضمينات النص في إدخال نص. لمزيد من المعلومات حول نموذج تضمين النص، انتقل إلى مستندات الذكاء الاصطناعي التوليدي على Vertex AI حول تضمينات النص.

تم تحسين نموذج تضمين النص لإنشاء تضمينات بتنسيق 768 وأبعاد النص لما يصل إلى 2048 رمزًا مميزًا. تضمين النص في تجربة أكثر مرونة أحجام التضمين أقل من 768. يمكنك استخدام التضمينات المرنة لإنشاء أصغر حجم للمخرجات وقد يوفر ذلك تكاليف الحوسبة والتخزين مع فقدان طفيف في الأداء.

تفاصيل الطراز
الموقع الوصف
رمز الطراز

Gemini API

models/text-embedding-004

Vertex AI

text-embedding-preview-0409

أنواع البيانات المتوافقة

الإدخال

النص

الناتج

تضمينات النص

حدود الرموز المميزة[*]

الحد الأقصى لإدخال الرموز المميّزة

2,048

حجم بُعد الإخراج

768

حدود السعر[**] 1,500 طلب في الدقيقة
إعدادات أمان قابلة للتعديل غير متاح
آخر تحديث أبريل 2024

التضمين

يمكنك استخدام نموذج التضمين لإنشاء تضمينات النص في إدخال نص.

تم تحسين نموذج التضمين لإنشاء عمليات تضمين بحجم 768. للنصوص التي تصل إلى 2,048 رمزًا مميزًا.

تضمين تفاصيل النموذج
الموقع الوصف
رمز الطراز models/embedding-001
أنواع البيانات المتوافقة

الإدخال

النص

الناتج

تضمينات النص

حدود الرموز المميزة[*]

الحد الأقصى لإدخال الرموز المميّزة

2,048

حجم بُعد الإخراج

768

حدود السعر[**] 1,500 طلب في الدقيقة
إعدادات أمان قابلة للتعديل غير متاح
آخر تحديث كانون الأول (ديسمبر) 2023

جودة الهواء

يمكنك استخدام نموذج AQA لإجراء الإجابة عن أسئلة تحديد المصدر (AQA) - المهام المتعلقة بمستند أو مجموعة من الفقرات. مؤشر جودة الهواء إجابات عن الأسئلة القائمة على المصادر المتوفرة إلى جانب تقدير الاحتمالية القابلة للإجابة.

تفاصيل الطراز

الموقع الوصف
رمز الطراز models/aqa
أنواع البيانات المتوافقة

الإدخال

النص

الناتج

النص

اللغات المتاحة الإنجليزية
حدود الرموز المميزة[*]

الحد الأقصى لإدخال الرموز المميّزة

7,168

حد الرمز المميّز للإخراج

1,024

حدود السعر[**] 1,500 طلب في الدقيقة
إعدادات أمان قابلة للتعديل متاح
آخر تحديث كانون الأول (ديسمبر) 2023

اطّلِع على الأمثلة لاستكشاف إمكانات هذه النماذج. المختلفة.

[*] يعادل الرمز المميّز 4 أحرف تقريبًا في نماذج Gemini. 100 رمز مميّز حوالي 60-80 كلمة إنجليزية.

[**] RPM: عدد الطلبات في الدقيقة
TPM: عدد الرموز المميّزة في الدقيقة
RPD: الطلبات في اليوم
TPD: الرموز المميّزة في اليوم

بسبب القيود المفروضة على السعة، لا يتم ضبط الحدود القصوى لمعدّل الاستخدام. مضمون.

أنماط اسم إصدار النموذج

تتوفّر نماذج Gemini إما في إصدار المعاينة أو الثابت. في يمكنك استخدام أحد تنسيقات أسماء النماذج التالية لتحديد النموذج والإصدار الذي تريد استخدامه.

  • الأحدث: يشير هذا المصطلح إلى أحدث إصدار من النموذج لنموذج الإنشاء والتباين. يتم تحديث النموذج الأساسي بانتظام وقد إصدار معاينة. يجب فقط تطبيقات الاختبار الاستكشافي والنماذج الأولية استخدام هذا الاسم المستعار.

    لتحديد أحدث إصدار، استخدِم النمط التالي: <model>-<generation>-<variation>-latest على سبيل المثال: gemini-1.0-pro-latest

  • أحدث إصدار ثابت: يشير إلى أحدث إصدار ثابت تم طرحه إنشاء نموذج محدد وتنوعه.

    لتحديد أحدث إصدار ثابت، استخدِم النمط التالي: <model>-<generation>-<variation> مثلاً: gemini-1.0-pro

  • ثابت: يشير إلى نموذج ثابت معيَّن. لا تتغير النماذج الثابتة. يجب أن تستخدم معظم تطبيقات الإنتاج طرازًا ثابتًا ومحددًا.

    لتحديد إصدار ثابت، استخدم النمط التالي: <model>-<generation>-<variation>-<version> على سبيل المثال: gemini-1.0-pro-001

اللغات المتاحة

يتم تدريب نماذج Gemini على العمل باللغات التالية:

  • العربية (ar)
  • البنغالية (bn)
  • البلغارية (bg)
  • الصينية المبسّطة والتقليدية (zh)
  • الكرواتية (hr)
  • التشيكية (cs)
  • الدانمركية (da)
  • الهولندية (nl)
  • الإنجليزية (en)
  • الإستونية (et)
  • الفنلندية (fi)
  • الفرنسية (fr)
  • الألمانية (de)
  • اليونانية (el)
  • العبرية (iw)
  • الهندية (hi)
  • الهنغارية (hu)
  • الإندونيسية (id)
  • الإيطالية (it)
  • اليابانية (ja)
  • الكورية (ko)
  • اللاتفية (lv)
  • الليتوانية (lt)
  • النرويجية (no)
  • البولندية (pl)
  • البرتغالية (pt)
  • الرومانية (ro)
  • الروسية (ru)
  • الصربية (sr)
  • السلوفاكية (sk)
  • السلوفينية (sl)
  • الإسبانية (es)
  • السواحيلية (sw)
  • السويدية (sv)
  • التايلاندية (th)
  • التركية (tr)
  • الأوكرانية (uk)
  • الفيتنامية (vi)