Gemini Deep Research اکنون به صورت پیش‌نمایش با برنامه‌ریزی مشارکتی، تجسم، پشتیبانی MCP و موارد دیگر در دسترس است.

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 یک مدل بینایی-زبانی (VLM) است که قابلیت‌های عامل‌محور Gemini را به رباتیک می‌آورد. این مدل برای استدلال پیشرفته در دنیای فیزیکی طراحی شده است و به ربات‌ها اجازه می‌دهد داده‌های بصری پیچیده را تفسیر کنند، استدلال فضایی انجام دهند و اقدامات را از طریق دستورات زبان طبیعی برنامه‌ریزی کنند.

در استودیوی هوش مصنوعی گوگل امتحان کنید

مستندات

برای مشاهده‌ی امکانات و قابلیت‌های کامل، به صفحه‌ی رباتیک مراجعه کنید.

پیش‌نمایش Gemini-robotics-er-1.5

ملک	توضیحات
کد مدل	`gemini-robotics-er-1.5-preview`
انواع داده پشتیبانی شده را	ورودی‌ها متن، تصویر، ویدئو، صدا خروجی متن
محدودیت‌های توکن ^[*]	محدودیت توکن ورودی ۱,۰۴۸,۵۷۶ محدودیت توکن خروجی ۶۵,۵۳۶
قابلیت‌های	تولید صدا پشتیبانی نمی‌شود API دسته‌ای پشتیبانی نمی‌شود ذخیره سازی پشتیبانی نمی‌شود اجرای کد پشتیبانی شده فراخوانی تابع پشتیبانی شده اتصال به زمین با نقشه‌های گوگل پشتیبانی نمی‌شود تولید تصویر پشتیبانی نمی‌شود API زنده پشتیبانی نمی‌شود جستجوی اتصال به زمین پشتیبانی شده خروجی‌های ساختاریافته پشتیبانی شده تفکر پشتیبانی شده زمینه URL پشتیبانی شده
نسخه	برای جزئیات بیشتر ، الگوهای نسخه مدل را مطالعه کنید. پیش‌نمایش: پیش‌نمایش `gemini-robotics-er-1.5-preview`
آخرین به‌روزرسانی	سپتامبر ۲۰۲۵
حد آستانه دانش	ژانویه ۲۰۲۵