Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 คือโมเดลภาษาและวิสัยทัศน์ (VLM) ที่นำความสามารถด้าน Agentic AI ของ Gemini มาใช้กับหุ่นยนต์ โดยได้รับการออกแบบมาเพื่อการให้เหตุผลขั้นสูงในโลกทางกายภาพ ซึ่งช่วยให้หุ่นยนต์ตีความข้อมูลภาพที่ซับซ้อน ทำการให้เหตุผลเชิงพื้นที่ และวางแผนการดำเนินการจากคำสั่งภาษาธรรมชาติได้

เอกสารประกอบ

ไปที่หน้า หุ่นยนต์ เพื่อดูฟีเจอร์และความสามารถทั้งหมด

gemini-robotics-er-1.6-preview

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล gemini-robotics-er-1.6-preview
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ รูปภาพ วิดีโอ เสียง

เอาต์พุต

ข้อความ

ขีดจำกัดโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

131,072

ขีดจำกัดโทเค็นเอาต์พุต

65,536

ความสามารถ

การสร้างเสียง

ไม่รองรับ

การแคช

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

การใช้คอมพิวเตอร์

สิ่งที่ทำได้

การค้นหาไฟล์

สิ่งที่ทำได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเชื่อมต่อแหล่งข้อมูลกับ Google Maps

สิ่งที่ทำได้

การสร้างรูปภาพ

ไม่รองรับ

Live API

ไม่รองรับ

การเชื่อมต่อแหล่งข้อมูลของ Search

สิ่งที่ทำได้

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การคิด

สิ่งที่ทำได้

บริบท URL

สิ่งที่ทำได้

ตัวเลือกการใช้งาน

Batch API

สิ่งที่ทำได้

การอนุมานแบบยืดหยุ่น

สิ่งที่ทำได้

การอนุมานตามลำดับความสำคัญ

สิ่งที่ทำได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • เวอร์ชันตัวอย่าง: gemini-robotics-er-1.6-preview
การอัปเดตล่าสุด ธันวาคม 2025
วันที่สิ้นสุดความรู้ มกราคม 2025