Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 là một mô hình thị giác-ngôn ngữ (VLM) mang các khả năng của tác nhân AI của Gemini vào lĩnh vực robot học. Mô hình này được thiết kế để suy luận nâng cao trong thế giới thực, cho phép robot diễn giải dữ liệu hình ảnh phức tạp, thực hiện suy luận không gian và lập kế hoạch hành động từ các lệnh bằng ngôn ngữ tự nhiên.

Tài liệu

Truy cập trang Robotics để xem thông tin đầy đủ về các tính năng và chức năng.

gemini-robotics-er-1.6-preview

Thuộc tính Mô tả
Mã kiểu máy gemini-robotics-er-1.6-preview
Các loại dữ liệu được hỗ trợ

Thông tin đầu vào

Văn bản, hình ảnh, video, âm thanh

Đầu ra

Văn bản

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

1.048.576

Giới hạn mã thông báo đầu ra

65.536

Chức năng

Tạo âm thanh

Không được hỗ trợ

Batch API

Được hỗ trợ

Lưu vào bộ nhớ đệm

Được hỗ trợ

Thực thi mã

Được hỗ trợ

Sử dụng máy tính

Được hỗ trợ

Tìm kiếm tệp

Được hỗ trợ

Suy luận linh hoạt

Được hỗ trợ

Gọi hàm

Được hỗ trợ

Kết nối với Google Maps

Được hỗ trợ

Tạo hình ảnh

Không được hỗ trợ

Live API

Không được hỗ trợ

Suy luận mức độ ưu tiên

Được hỗ trợ

Tìm trong phần liên kết thực tế

Được hỗ trợ

Đầu ra có cấu trúc

Được hỗ trợ

Tư duy

Được hỗ trợ

Bối cảnh URL

Được hỗ trợ

Phiên bản
Đọc các mẫu phiên bản mô hình để biết thêm thông tin chi tiết.
  • Xem trước: gemini-robotics-er-1.6-preview
Thông tin cập nhật mới nhất Tháng 12 năm 2025
Điểm cắt kiến thức Tháng 1 năm 2025