Interactions API 现已正式发布。我们建议使用此 API 来访问所有最新功能和模型。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 是一种视觉语言模型 (VLM)，可将 Gemini 的智能体功能引入机器人技术。它专为物理世界中的高级推理而设计，可让机器人解读复杂的视觉数据、执行空间推理，并根据自然语言命令规划行动。

文档

如需全面了解各项功能，请访问机器人技术页面。

属性	说明
模型代码	`gemini-robotics-er-1.6-preview`
支持的数据类型	输入文字、图片、视频、音频输出文字
Token 限制^[*]	输入 token 限制 131,072 输出 token 限制 65,536
功能	音频生成不支持缓存支持代码执行支持计算机使用支持文件搜索支持函数调用支持 Grounding with Google Maps 支持图片生成不支持 Live API 不支持搜索接地支持结构化输出支持思考型支持网址上下文支持
消耗选项	批量 API 支持灵活推理支持优先推理支持
版本	如需了解详情，请参阅模型版本模式。预览：`gemini-robotics-er-1.6-preview`
最新更新	2025 年 12 月
知识截点	2025 年 1 月