Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 เป็นโมเดลภาษาและวิสัยทัศน์ (VLM) ที่นำความสามารถด้าน Agentic AI ของ Gemini มาใช้กับหุ่นยนต์ โดยได้รับการออกแบบมาเพื่อการให้เหตุผลขั้นสูงในโลกทางกายภาพ ซึ่งช่วยให้หุ่นยนต์ตีความข้อมูลภาพที่ซับซ้อน ทำการให้เหตุผลเชิงพื้นที่ และวางแผนการดำเนินการจากคำสั่งภาษาธรรมชาติได้

เอกสารประกอบ

ไปที่หน้า Robotics เพื่อดูฟีเจอร์และความสามารถทั้งหมด

gemini-robotics-er-1.6-preview

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล gemini-robotics-er-1.6-preview
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ รูปภาพ วิดีโอ เสียง

เอาต์พุต

ข้อความ

ขีดจำกัดโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

131,072

ขีดจำกัดโทเค็นเอาต์พุต

65,536

ความสามารถ

การสร้างเสียง

ไม่รองรับ

Batch API

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การรันโค้ด

สิ่งที่ทำได้

การใช้คอมพิวเตอร์

สิ่งที่ทำได้

การค้นหาไฟล์

สิ่งที่ทำได้

การอนุมานแบบยืดหยุ่น

สิ่งที่ทำได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเชื่อมต่อแหล่งข้อมูลกับ Google Maps

สิ่งที่ทำได้

การสร้างรูปภาพ

ไม่รองรับ

Live API

ไม่รองรับ

การอนุมานตามลำดับความสำคัญ

สิ่งที่ทำได้

การเชื่อมต่อแหล่งข้อมูลของ Search

สิ่งที่ทำได้

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การคิด

สิ่งที่ทำได้

บริบท URL

สิ่งที่ทำได้

เวอร์ชัน
อ่านรูปแบบเวอร์ชันของโมเดลเพื่อดูรายละเอียดเพิ่มเติม
  • เวอร์ชันตัวอย่าง: gemini-robotics-er-1.6-preview
การอัปเดตล่าสุด ธันวาคม 2025
วันที่สิ้นสุดความรู้ มกราคม 2025