Gemini Robotics-ER 1.6 là một mô hình ngôn ngữ thị giác (VLM) mang các khả năng của tác nhân AI của Gemini đến với ngành robot. Mô hình này được thiết kế để suy luận nâng cao trong thế giới thực, cho phép robot diễn giải dữ liệu hình ảnh phức tạp, suy luận không gian và lên kế hoạch hành động từ các lệnh bằng ngôn ngữ tự nhiên.
Tài liệu
Truy cập vào trang Robotics để xem toàn bộ các tính năng và khả năng.
gemini-robotics-er-1.6-preview
| Thuộc tính | Mô tả |
|---|---|
| Mã mô hình | gemini-robotics-er-1.6-preview |
| Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Văn bản, hình ảnh, video, âm thanh Đầu ra Văn bản |
| Giới hạn mã thông báo[*] |
Giới hạn mã thông báo đầu vào 131.072 Giới hạn mã thông báo đầu ra 65.536 |
| Các khả năng | Không được hỗ trợ Được hỗ trợ Được hỗ trợ Được hỗ trợ Được hỗ trợ Được hỗ trợ Liên kết thực tế với Google Maps Được hỗ trợ Không được hỗ trợ Không được hỗ trợ Tìm trong phần liên kết thực tế Được hỗ trợ Được hỗ trợ Được hỗ trợ Được hỗ trợ |
| Các lựa chọn về mức tiêu thụ |
Được hỗ trợ Được hỗ trợ Được hỗ trợ |
| Phiên bản |
|
| Bản cập nhật mới nhất | Tháng 12 năm 2025 |
| Điểm cắt kiến thức | Tháng 1 năm 2025 |