Gemini Robotics-ER 1.6 là một mô hình thị giác-ngôn ngữ (VLM) mang các khả năng của tác nhân AI Gemini đến với ngành robot. Mô hình này được thiết kế để suy luận nâng cao trong thế giới thực, cho phép robot diễn giải dữ liệu hình ảnh phức tạp, thực hiện suy luận không gian và lên kế hoạch hành động từ các lệnh bằng ngôn ngữ tự nhiên.
Tài liệu
Truy cập vào trang Robotics (Robot) để xem toàn bộ các tính năng và khả năng.
gemini-robotics-er-1.6-preview
| Thuộc tính | Mô tả |
|---|---|
| Mã mô hình | gemini-robotics-er-1.6-preview |
| Các loại dữ liệu được hỗ trợ |
Thông tin đầu vào Văn bản, hình ảnh, video, âm thanh Đầu ra Văn bản |
| Giới hạn mã thông báo[*] |
Giới hạn mã thông báo đầu vào 1.048.576 Giới hạn mã thông báo đầu ra 65.536 |
| Các khả năng |
Tạo âm thanh Không được hỗ trợ API hàng loạt Được hỗ trợ Lưu vào bộ nhớ đệm Được hỗ trợ Thực thi mã Được hỗ trợ Sử dụng máy tính Được hỗ trợ Tìm kiếm tệp Được hỗ trợ Suy luận linh hoạt Được hỗ trợ Gọi hàm Được hỗ trợ Kết nối với Google Maps Được hỗ trợ Tạo hình ảnh Không được hỗ trợ API trực tiếp Không được hỗ trợ Suy luận mức độ ưu tiên Được hỗ trợ Tìm trong phần liên kết thực tế Được hỗ trợ Đầu ra có cấu trúc Được hỗ trợ Tư duy Được hỗ trợ Ngữ cảnh URL Được hỗ trợ |
| Phiên bản |
|
| Bản cập nhật mới nhất | Tháng 12 năm 2025 |
| Điểm cắt kiến thức | Tháng 1 năm 2025 |