ตอนนี้ Interactions API พร้อมให้บริการแก่ผู้ใช้ทั่วไปแล้ว เราขอแนะนำให้ใช้ API นี้เพื่อเข้าถึงฟีเจอร์และโมเดลล่าสุดทั้งหมด

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 คือโมเดลภาษาและวิสัยทัศน์ (VLM) ที่นำความสามารถด้าน Agentic AI ของ Gemini มาใช้กับหุ่นยนต์ โดยได้รับการออกแบบมาเพื่อการให้เหตุผลขั้นสูงในโลกทางกายภาพ ซึ่งช่วยให้หุ่นยนต์ตีความข้อมูลภาพที่ซับซ้อน ทำการให้เหตุผลเชิงพื้นที่ และวางแผนการดำเนินการจากคำสั่งภาษาธรรมชาติได้

ลองใช้ใน Google AI Studio

เอกสารประกอบ

ไปที่หน้า หุ่นยนต์ เพื่อดูฟีเจอร์และความสามารถทั้งหมด

gemini-robotics-er-1.6-preview

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`gemini-robotics-er-1.6-preview`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ รูปภาพ วิดีโอ เสียง เอาต์พุต ข้อความ
ขีดจำกัดโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 131,072 ขีดจำกัดโทเค็นเอาต์พุต 65,536
ความสามารถ	การสร้างเสียง ไม่รองรับ การแคช สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้ การใช้คอมพิวเตอร์ สิ่งที่ทำได้ การค้นหาไฟล์ สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเชื่อมต่อแหล่งข้อมูลกับ Google Maps สิ่งที่ทำได้ การสร้างรูปภาพ ไม่รองรับ Live API ไม่รองรับ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำได้ เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การคิด สิ่งที่ทำได้ บริบท URL สิ่งที่ทำได้
ตัวเลือกการใช้งาน	Batch API สิ่งที่ทำได้ การอนุมานแบบยืดหยุ่น สิ่งที่ทำได้ การอนุมานตามลำดับความสำคัญ สิ่งที่ทำได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล เวอร์ชันตัวอย่าง: `gemini-robotics-er-1.6-preview`
การอัปเดตล่าสุด	ธันวาคม 2025
วันที่สิ้นสุดความรู้	มกราคม 2025