Gemini Robotics-ER 1.6 هو نموذج للرؤية واللغة (VLM) يتيح استخدام إمكانات Gemini بالذكاء الاصطناعي الوكيل في مجال الروبوتات. وهو مصمّم لإجراء عمليات الاستدلال المتقدّم في العالم المادي، ما يتيح للروبوتات تفسير البيانات المرئية المعقّدة وإجراء عمليات الاستدلال المكاني وتخطيط الإجراءات من خلال الأوامر باللغة الطبيعية.
الوثائق
انتقِل إلى صفحة الروبوتات للاطّلاع على التغطية الكاملة للميزات والإمكانات.
gemini-robotics-er-1.6-preview
| الموقع | الوصف |
|---|---|
| رمز النموذج | gemini-robotics-er-1.6-preview |
| أنواع البيانات المتوافقة |
المدخلات النصوص والصور والفيديوهات والمحتوى الصوتي الناتج نص |
| حدود الرموز المميزة[*] |
الحدّ الأقصى لعدد الرموز المميزة التي يمكن إدخالها 1,048,576 الحد الأقصى لعدد الرموز المميزة في الناتج 65,536 |
| الإمكانات |
إنشاء الصوت غير متاح Batch API متاح التخزين المؤقت متاح تنفيذ الرموز البرمجية متاح استخدام الكمبيوتر متاح البحث عن الملفات متاح الاستدلال المرن متاح استدعاء الدوال متاح استخدام "خرائط Google" كمصدر متاح إنشاء الصور غير متاح Live API غير متاح استنتاج الأولوية متاح تحديد المصادر في "بحث Google" متاح المخرجات المنظَّمة متاح التفكير متاح سياق عنوان URL متاح |
| الإصدارات |
|
| آخر تعديل | ديسمبر 2025 |
| تاريخ آخر تحديث للبيانات | يناير 2025 |