Gemini Deep Research 現已推出預先發布版，提供協作規劃、視覺化、MCP 支援等功能。

Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 是視覺語言模型 (VLM)，可將 Gemini 的代理功能帶入機器人領域。這項技術專為實體世界的高階推論而設計，可讓機器人解讀複雜的視覺資料、執行空間推論，並根據自然語言指令規劃動作。

說明文件

如要全面瞭解功能與能力，請前往「機器人」頁面。

屬性	說明
模型代碼	`gemini-robotics-er-1.5-preview`
支援的資料類型	輸入裝置文字、圖片、影片、音訊輸出內容文字
代幣限制^[*]	輸入權杖限制 1,048,576 輸出詞元限制 65,536
功能	語音生成不支援批次 API 不支援快取不支援程式碼執行支援函式呼叫支援利用 Google 地圖建立基準不支援圖像生成不支援 Live API 不支援搜尋基準支援結構化輸出內容支援思考型支援網址內容支援
個版本	如要瞭解詳情，請參閱模型版本模式。預覽：`gemini-robotics-er-1.5-preview`
最新更新	2025 年 9 月
知識截點	2025 年 1 月