Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 是視覺語言模型 (VLM),可將 Gemini 的代理功能帶入機器人領域。這項技術專為實體世界的高階推論而設計,可讓機器人解讀複雜的視覺資料、執行空間推論,並根據自然語言指令規劃動作。

說明文件

如要全面瞭解功能與能力,請前往「機器人」頁面。

gemini-robotics-er-1.6-preview

屬性 說明
模型代碼 gemini-robotics-er-1.6-preview
支援的資料類型

輸入裝置

文字、圖片、影片、音訊

輸出內容

文字

代幣限制[*]

輸入權杖限制

1,048,576

輸出詞元限制

65,536

功能

語音生成

不支援

批次 API

支援

快取

支援

程式碼執行

支援

電腦使用

支援

檔案搜尋

支援

Flex 推論

支援

函式呼叫

支援

利用 Google 地圖建立基準

支援

圖像生成

不支援

Live API

不支援

優先推論

支援

搜尋基準

支援

結構化輸出內容

支援

思考型

支援

網址內容

支援

個版本
如要瞭解詳情,請參閱模型版本模式
  • 預覽:gemini-robotics-er-1.6-preview
最新更新 2025 年 12 月
知識截點 2025 年 1 月