ربات Gemini-ER 1.6

Gemini Robotics-ER 1.6 یک مدل زبان بینایی (VLM) است که قابلیت‌های عامل‌محور Gemini را به رباتیک می‌آورد. این مدل برای استدلال پیشرفته در دنیای فیزیکی طراحی شده است و به ربات‌ها اجازه می‌دهد داده‌های بصری پیچیده را تفسیر کنند، استدلال فضایی انجام دهند و اقدامات را از طریق دستورات زبان طبیعی برنامه‌ریزی کنند.

مستندات

برای مشاهده‌ی امکانات و قابلیت‌های کامل، به صفحه‌ی رباتیک مراجعه کنید.

پیش‌نمایش Gemini-robotics-er-1.6

ملک توضیحات
کد مدل gemini-robotics-er-1.6-preview
انواع داده پشتیبانی شده را

ورودی‌ها

متن، تصویر، ویدئو، صدا

خروجی

متن

محدودیت‌های توکن [*]

محدودیت توکن ورودی

۱,۰۴۸,۵۷۶

محدودیت توکن خروجی

۶۵,۵۳۶

قابلیت‌های

تولید صدا

پشتیبانی نمی‌شود

API دسته‌ای

پشتیبانی شده

ذخیره سازی

پشتیبانی شده

اجرای کد

پشتیبانی شده

استفاده از کامپیوتر

پشتیبانی شده

جستجوی فایل

پشتیبانی شده

استنتاج انعطاف‌پذیر

پشتیبانی شده

فراخوانی تابع

پشتیبانی شده

اتصال به زمین با نقشه‌های گوگل

پشتیبانی شده

تولید تصویر

پشتیبانی نمی‌شود

API زنده

پشتیبانی نمی‌شود

استنتاج اولویت

پشتیبانی شده

جستجوی اتصال به زمین

پشتیبانی شده

خروجی‌های ساختاریافته

پشتیبانی شده

تفکر

پشتیبانی شده

زمینه URL

پشتیبانی شده

نسخه
برای جزئیات بیشتر ، الگوهای نسخه مدل را مطالعه کنید.
  • پیش‌نمایش: پیش‌نمایش gemini-robotics-er-1.6-preview
آخرین به‌روزرسانی دسامبر ۲۰۲۵
حد آستانه دانش ژانویه ۲۰۲۵