ربات Gemini-ER 1.6

Gemini Robotics-ER 1.6 یک مدل زبان بینایی (VLM) است که قابلیت‌های عامل‌محور Gemini را به رباتیک می‌آورد. این مدل برای استدلال پیشرفته در دنیای فیزیکی طراحی شده است و به ربات‌ها اجازه می‌دهد داده‌های بصری پیچیده را تفسیر کنند، استدلال فضایی انجام دهند و اقدامات را از طریق دستورات زبان طبیعی برنامه‌ریزی کنند.

مستندات

برای مشاهده‌ی امکانات و قابلیت‌های کامل، به صفحه‌ی رباتیک مراجعه کنید.

پیش‌نمایش Gemini-robotics-er-1.6

ملک توضیحات
کد مدل gemini-robotics-er-1.6-preview
انواع داده پشتیبانی شده را

ورودی‌ها

متن، تصویر، ویدئو، صدا

خروجی

متن

محدودیت‌های توکن [*]

محدودیت توکن ورودی

۱۳۱,۰۷۲

محدودیت توکن خروجی

۶۵,۵۳۶

قابلیت‌های

تولید صدا

پشتیبانی نمی‌شود

ذخیره سازی

پشتیبانی شده

اجرای کد

پشتیبانی شده

استفاده از کامپیوتر

پشتیبانی شده

جستجوی فایل

پشتیبانی شده

فراخوانی تابع

پشتیبانی شده

اتصال به زمین با نقشه‌های گوگل

پشتیبانی شده

تولید تصویر

پشتیبانی نمی‌شود

API زنده

پشتیبانی نمی‌شود

جستجوی اتصال به زمین

پشتیبانی شده

خروجی‌های ساختاریافته

پشتیبانی شده

تفکر

پشتیبانی شده

زمینه URL

پشتیبانی شده

گزینه‌های مصرف

API دسته‌ای

پشتیبانی شده

استنتاج انعطاف‌پذیر

پشتیبانی شده

استنتاج اولویت

پشتیبانی شده

نسخه
برای جزئیات بیشتر ، الگوهای نسخه مدل را مطالعه کنید.
  • پیش‌نمایش: پیش‌نمایش gemini-robotics-er-1.6-preview
آخرین به‌روزرسانی دسامبر ۲۰۲۵
حد آستانه دانش ژانویه ۲۰۲۵