Gemini Robotics-ER 1.6 是視覺語言模型 (VLM),可將 Gemini 的代理功能帶入機器人領域。這項技術專為實體世界的高階推論而設計,可讓機器人解讀複雜的視覺資料、執行空間推論,並根據自然語言指令規劃動作。
說明文件
如要全面瞭解功能與能力,請前往「機器人」頁面。
gemini-robotics-er-1.6-preview
| 屬性 | 說明 |
|---|---|
| 模型代碼 | gemini-robotics-er-1.6-preview |
| 支援的資料類型 |
輸入裝置 文字、圖片、影片、音訊 輸出內容 文字 |
| 代幣限制[*] |
輸入權杖限制 1,048,576 輸出詞元限制 65,536 |
| 功能 |
語音生成 不支援 批次 API 支援 快取 支援 程式碼執行 支援 電腦使用 支援 檔案搜尋 支援 Flex 推論 支援 函式呼叫 支援 利用 Google 地圖建立基準 支援 圖像生成 不支援 Live API 不支援 優先推論 支援 搜尋基準 支援 結構化輸出內容 支援 思考型 支援 網址內容 支援 |
| 個版本 |
|
| 最新更新 | 2025 年 12 月 |
| 知識截點 | 2025 年 1 月 |