Gemini Robotics-ER 1.5 هو نموذج للرؤية واللغة (VLM) يتيح استخدام إمكانات Gemini المستندة إلى الوكلاء في مجال الروبوتات. تم تصميم هذا النموذج لإجراء عمليات استنتاج متقدّمة في العالم المادي، ما يتيح للروبوتات تفسير البيانات المرئية المعقّدة، وإجراء عمليات استنتاج مكانية، وتخطيط الإجراءات من خلال الأوامر باللغة الطبيعية.
الوثائق
انتقِل إلى صفحة الروبوتات للاطّلاع على التغطية الكاملة للميزات والإمكانات.
gemini-robotics-er-1.5-preview
| الموقع | الوصف |
|---|---|
| رمز النموذج | gemini-robotics-er-1.5-preview |
| أنواع البيانات المتوافقة |
المدخلات النصوص والصور والفيديوهات والمحتوى الصوتي الناتج نص |
| حدود الرموز المميزة[*] |
حد الرموز المميزة المدخلة 1,048,576 الحد الأقصى لعدد الرموز المميزة في الناتج 65,536 |
| الإمكانات |
إنشاء الصوت غير متاح Batch API غير متاح التخزين المؤقت غير متاح تنفيذ الرمز متاح استدعاء الدوال متاح استخدام "خرائط Google" كمصدر غير متاح إنشاء الصور غير متاح Live API غير متاح تحديد المصادر في "بحث Google" متاح المخرجات المنظَّمة متاح التفكير متاح سياق عنوان URL متاح |
| إصدارات |
|
| آخر تعديل | سبتمبر 2025 |
| تاريخ آخر تحديث للبيانات | يناير 2025 |