Gemini Robotics-ER 1.6 هو نموذج لغوي مرئي (VLM) يوفّر إمكانات Gemini بالذكاء الاصطناعي الوكيل في مجال الروبوتات. تم تصميم هذا النموذج لإجراء عمليات الاستدلال المتقدّم في العالم المادي، ما يسمح للروبوتات بتفسير البيانات المرئية المعقّدة وإجراء عمليات استدلال مكانية وتخطيط الإجراءات من خلال الأوامر باللغة الطبيعية.
الوثائق
يمكنك الانتقال إلى صفحة الروبوتات للاطّلاع على تغطية كاملة للميزات والإمكانات.
gemini-robotics-er-1.6-preview
| الموقع | الوصف |
|---|---|
| رمز النموذج | gemini-robotics-er-1.6-preview |
| أنواع البيانات المتوافقة |
البيانات المُدخَلة نص، صور، فيديو، صوت البيانات الناتجة نص |
| حدود الرموز المميّزة[*] |
الحد الأقصى للرموز المميّزة المُدخَلة 131,072 الحد الأقصى للرموز المميّزة الناتجة 65,536 |
| الإمكانات |
إنشاء الصوت غير متاح واجهة برمجة التطبيقات المجمّعة متاحة التخزين المؤقت متاح تنفيذ الرموز البرمجية متاح استخدام الكمبيوتر متاح البحث عن الملفات متاح الاستنتاج المرن متاح استدعاء الدوال متاح استخدام "خرائط Google" كمصدر متاح إنشاء الصور غير متاح واجهة برمجة التطبيقات المباشرة غير متاحة الاستنتاج حسب الأولوية متاح لتحديد المصادر في "بحث Google" متاح مُخرجات منظَّمة متاحة طريقة التفكير متاحة سياق عنوان URL متاح |
| الإصدارات |
|
| آخر تعديل | ديسمبر 2025 |
| تاريخ آخر تحديث للبيانات | يناير 2025 |