Gemini Robotics-ER 1.6 یک مدل زبان بینایی (VLM) است که قابلیتهای عاملمحور Gemini را به رباتیک میآورد. این مدل برای استدلال پیشرفته در دنیای فیزیکی طراحی شده است و به رباتها اجازه میدهد دادههای بصری پیچیده را تفسیر کنند، استدلال فضایی انجام دهند و اقدامات را از طریق دستورات زبان طبیعی برنامهریزی کنند.
مستندات
برای مشاهدهی امکانات و قابلیتهای کامل، به صفحهی رباتیک مراجعه کنید.
پیشنمایش Gemini-robotics-er-1.6
| ملک | توضیحات |
|---|---|
| کد مدل | gemini-robotics-er-1.6-preview |
| انواع داده پشتیبانی شده را | ورودیها متن، تصویر، ویدئو، صدا خروجی متن |
| محدودیتهای توکن [*] | محدودیت توکن ورودی ۱,۰۴۸,۵۷۶ محدودیت توکن خروجی ۶۵,۵۳۶ |
| قابلیتهای | تولید صدا پشتیبانی نمیشود API دستهای پشتیبانی شده ذخیره سازی پشتیبانی شده اجرای کد پشتیبانی شده استفاده از کامپیوتر پشتیبانی شده جستجوی فایل پشتیبانی شده استنتاج انعطافپذیر پشتیبانی شده فراخوانی تابع پشتیبانی شده اتصال به زمین با نقشههای گوگل پشتیبانی شده تولید تصویر پشتیبانی نمیشود API زنده پشتیبانی نمیشود استنتاج اولویت پشتیبانی شده جستجوی اتصال به زمین پشتیبانی شده خروجیهای ساختاریافته پشتیبانی شده تفکر پشتیبانی شده زمینه URL پشتیبانی شده |
| نسخه |
|
| آخرین بهروزرسانی | دسامبر ۲۰۲۵ |
| حد آستانه دانش | ژانویه ۲۰۲۵ |