Gemini Robotics-ER 1.5 یک مدل بینایی-زبانی (VLM) است که قابلیتهای عاملمحور Gemini را به رباتیک میآورد. این مدل برای استدلال پیشرفته در دنیای فیزیکی طراحی شده است و به رباتها اجازه میدهد دادههای بصری پیچیده را تفسیر کنند، استدلال فضایی انجام دهند و اقدامات را از طریق دستورات زبان طبیعی برنامهریزی کنند.
مستندات
برای مشاهدهی امکانات و قابلیتهای کامل، به صفحهی رباتیک مراجعه کنید.
پیشنمایش Gemini-robotics-er-1.5
| ملک | توضیحات |
|---|---|
| کد مدل | gemini-robotics-er-1.5-preview |
| انواع داده پشتیبانی شده را | ورودیها متن، تصویر، ویدئو، صدا خروجی متن |
| محدودیتهای توکن [*] | محدودیت توکن ورودی ۱,۰۴۸,۵۷۶ محدودیت توکن خروجی ۶۵,۵۳۶ |
| قابلیتهای | تولید صدا پشتیبانی نمیشود API دستهای پشتیبانی نمیشود ذخیره سازی پشتیبانی نمیشود اجرای کد پشتیبانی شده فراخوانی تابع پشتیبانی شده اتصال به زمین با نقشههای گوگل پشتیبانی نمیشود تولید تصویر پشتیبانی نمیشود API زنده پشتیبانی نمیشود جستجوی اتصال به زمین پشتیبانی شده خروجیهای ساختاریافته پشتیبانی شده تفکر پشتیبانی شده زمینه URL پشتیبانی شده |
| نسخه |
|
| آخرین بهروزرسانی | سپتامبر ۲۰۲۵ |
| حد آستانه دانش | ژانویه ۲۰۲۵ |