Gemini Robotics-ER 1.5

‫Gemini Robotics-ER 1.5 هو نموذج للرؤية واللغة (VLM) يتيح استخدام إمكانات Gemini المستندة إلى الوكلاء في مجال الروبوتات. تم تصميم هذا النموذج لإجراء عمليات استنتاج متقدّمة في العالم المادي، ما يتيح للروبوتات تفسير البيانات المرئية المعقّدة، وإجراء عمليات استنتاج مكانية، وتخطيط الإجراءات من خلال الأوامر باللغة الطبيعية.

الوثائق

انتقِل إلى صفحة الروبوتات للاطّلاع على التغطية الكاملة للميزات والإمكانات.

gemini-robotics-er-1.5-preview

الموقع الوصف
رمز النموذج gemini-robotics-er-1.5-preview
أنواع البيانات المتوافقة

المدخلات

النصوص والصور والفيديوهات والمحتوى الصوتي

الناتج

نص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

1,048,576

الحد الأقصى لعدد الرموز المميزة في الناتج

65,536

الإمكانات

إنشاء الصوت

غير متاح

Batch API

غير متاح

التخزين المؤقت

غير متاح

تنفيذ الرمز

متاح

استدعاء الدوال

متاح

استخدام "خرائط Google" كمصدر

غير متاح

إنشاء الصور

غير متاح

Live API

غير متاح

تحديد المصادر في "بحث Google"

متاح

المخرجات المنظَّمة

متاح

التفكير

متاح

سياق عنوان URL

متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدارات النموذج لمزيد من التفاصيل.
  • معاينة: gemini-robotics-er-1.5-preview
آخر تعديل سبتمبر 2025
تاريخ آخر تحديث للبيانات يناير 2025