Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 یک مدل بینایی-زبانی (VLM) است که قابلیت‌های عامل‌محور Gemini را به رباتیک می‌آورد. این مدل برای استدلال پیشرفته در دنیای فیزیکی طراحی شده است و به ربات‌ها اجازه می‌دهد داده‌های بصری پیچیده را تفسیر کنند، استدلال فضایی انجام دهند و اقدامات را از طریق دستورات زبان طبیعی برنامه‌ریزی کنند.

مستندات

برای مشاهده‌ی امکانات و قابلیت‌های کامل، به صفحه‌ی رباتیک مراجعه کنید.

پیش‌نمایش Gemini-robotics-er-1.5

ملک توضیحات
کد مدل gemini-robotics-er-1.5-preview
انواع داده پشتیبانی شده را

ورودی‌ها

متن، تصویر، ویدئو، صدا

خروجی

متن

محدودیت‌های توکن [*]

محدودیت توکن ورودی

۱,۰۴۸,۵۷۶

محدودیت توکن خروجی

۶۵,۵۳۶

قابلیت‌های

تولید صدا

پشتیبانی نمی‌شود

API دسته‌ای

پشتیبانی نمی‌شود

ذخیره سازی

پشتیبانی نمی‌شود

اجرای کد

پشتیبانی شده

فراخوانی تابع

پشتیبانی شده

اتصال به زمین با نقشه‌های گوگل

پشتیبانی نمی‌شود

تولید تصویر

پشتیبانی نمی‌شود

API زنده

پشتیبانی نمی‌شود

جستجوی اتصال به زمین

پشتیبانی شده

خروجی‌های ساختاریافته

پشتیبانی شده

تفکر

پشتیبانی شده

زمینه URL

پشتیبانی شده

نسخه
برای جزئیات بیشتر ، الگوهای نسخه مدل را مطالعه کنید.
  • پیش‌نمایش: پیش‌نمایش gemini-robotics-er-1.5-preview
آخرین به‌روزرسانی سپتامبر ۲۰۲۵
حد آستانه دانش ژانویه ۲۰۲۵