Gemini Robotics-ER 1.6 เป็นโมเดลภาษาและวิสัยทัศน์ (VLM) ที่นำความสามารถด้าน Agentic AI ของ Gemini มาใช้กับหุ่นยนต์ โดยได้รับการออกแบบมาเพื่อการให้เหตุผลขั้นสูงในโลกทางกายภาพ ซึ่งช่วยให้หุ่นยนต์ตีความข้อมูลภาพที่ซับซ้อน ทำการให้เหตุผลเชิงพื้นที่ และวางแผนการดำเนินการจากคำสั่งภาษาธรรมชาติได้
เอกสารประกอบ
ไปที่หน้า Robotics เพื่อดูฟีเจอร์และความสามารถทั้งหมด
gemini-robotics-er-1.6-preview
| พร็อพเพอร์ตี้ | คำอธิบาย |
|---|---|
| รหัสโมเดล | gemini-robotics-er-1.6-preview |
| ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ รูปภาพ วิดีโอ เสียง เอาต์พุต ข้อความ |
| ขีดจำกัดโทเค็น[*] |
ขีดจำกัดโทเค็นอินพุต 131,072 ขีดจำกัดโทเค็นเอาต์พุต 65,536 |
| ความสามารถ |
การสร้างเสียง ไม่รองรับ Batch API สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ การใช้คอมพิวเตอร์ สิ่งที่ทำได้ การค้นหาไฟล์ สิ่งที่ทำได้ การอนุมานแบบยืดหยุ่น สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเชื่อมต่อแหล่งข้อมูลกับ Google Maps สิ่งที่ทำได้ การสร้างรูปภาพ ไม่รองรับ Live API ไม่รองรับ การอนุมานตามลำดับความสำคัญ สิ่งที่ทำได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำได้ เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การคิด สิ่งที่ทำได้ บริบท URL สิ่งที่ทำได้ |
| เวอร์ชัน |
|
| การอัปเดตล่าสุด | ธันวาคม 2025 |
| วันที่สิ้นสุดความรู้ | มกราคม 2025 |