Gemini Robotics-ER 1.5

‫Gemini Robotics-ER 1.5 هو نموذج للرؤية واللغة (VLM) يتيح استخدام إمكانات Gemini بالذكاء الاصطناعي الوكيل في مجال الروبوتات. وهو مصمّم لإجراء عمليات الاستدلال المتقدّم في العالم المادي، ما يتيح للروبوتات تفسير البيانات المرئية المعقّدة وإجراء عمليات الاستدلال المكاني وتخطيط الإجراءات من خلال الأوامر باللغة الطبيعية.

الوثائق

انتقِل إلى صفحة الروبوتات للاطّلاع على التغطية الكاملة للميزات والإمكانات.

gemini-robotics-er-1.5-preview

الموقع الوصف
رمز النموذج gemini-robotics-er-1.5-preview
أنواع البيانات المتوافقة

المدخلات

النصوص والصور والفيديوهات والمحتوى الصوتي

الناتج

نص

حدود الرموز المميزة[*]

الحدّ الأقصى لعدد الرموز المميزة التي يمكن إدخالها

1,048,576

الحد الأقصى لعدد الرموز المميزة في الناتج

65,536

الإمكانات

إنشاء الصوت

غير متاح

Batch API

غير متاح

التخزين المؤقت

غير متاح

تنفيذ الرموز البرمجية

متاح

استدعاء الدوال

متاح

استخدام "خرائط Google" كمصدر

غير متاح

إنشاء الصور

غير متاح

Live API

غير متاح

تحديد المصادر في "بحث Google"

متاح

المخرجات المنظَّمة

متاح

التفكير

متاح

سياق عنوان URL

متاح

الإصدارات
يمكنك الاطّلاع على أنماط إصدارات النموذج لمزيد من التفاصيل.
  • معاينة: gemini-robotics-er-1.5-preview
آخر تعديل سبتمبر 2025
تاريخ آخر تحديث للبيانات يناير 2025