Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 là một mô hình thị giác-ngôn ngữ (VLM) mang các khả năng của tác nhân AI Gemini đến với ngành robot. Mô hình này được thiết kế để suy luận nâng cao trong thế giới thực, cho phép robot diễn giải dữ liệu hình ảnh phức tạp, thực hiện suy luận không gian và lên kế hoạch hành động từ các lệnh bằng ngôn ngữ tự nhiên.

Tài liệu

Truy cập vào trang Robotics (Robot) để xem toàn bộ các tính năng và khả năng.

gemini-robotics-er-1.6-preview

Thuộc tính Mô tả
Mã mô hình gemini-robotics-er-1.6-preview
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Văn bản, hình ảnh, video, âm thanh

Đầu ra

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

65.536

Các khả năng

Tạo âm thanh

Không được hỗ trợ

API hàng loạt

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Sử dụng máy tính

Được hỗ trợ

Tìm kiếm tệp

Được hỗ trợ

Suy luận linh hoạt

Được hỗ trợ

Gọi hàm

Được hỗ trợ

Kết nối với Google Maps

Được hỗ trợ

Tạo hình ảnh

Không được hỗ trợ

API trực tiếp

Không được hỗ trợ

Suy luận mức độ ưu tiên

Được hỗ trợ

Tìm trong phần liên kết thực tế

Được hỗ trợ

Đầu ra có cấu trúc

Được hỗ trợ

Tư duy

Được hỗ trợ

Ngữ cảnh URL

Được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm chi tiết.
  • Xem trước: gemini-robotics-er-1.6-preview
Bản cập nhật mới nhất Tháng 12 năm 2025
Điểm cắt kiến thức Tháng 1 năm 2025