Gemini Deep Research พร้อมให้บริการในเวอร์ชันพรีวิวแล้วตอนนี้ โดยมีฟีเจอร์การวางแผนร่วมกัน การแสดงภาพข้อมูล การรองรับ MCP และอื่นๆ

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 เป็นโมเดลภาษาและวิสัยทัศน์ (VLM) ที่นำความสามารถด้าน Agentic AI ของ Gemini มาใช้กับหุ่นยนต์ โดยได้รับการออกแบบมาเพื่อการให้เหตุผลขั้นสูงในโลกทางกายภาพ ซึ่งช่วยให้หุ่นยนต์ตีความข้อมูลภาพที่ซับซ้อน ทำการให้เหตุผลเชิงพื้นที่ และวางแผนการดำเนินการจากคำสั่งภาษาธรรมชาติได้

ลองใช้ใน Google AI Studio

เอกสารประกอบ

ไปที่หน้า Robotics เพื่อดูฟีเจอร์และความสามารถทั้งหมด

gemini-robotics-er-1.6-preview

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`gemini-robotics-er-1.6-preview`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ รูปภาพ วิดีโอ เสียง เอาต์พุต ข้อความ
ขีดจำกัดโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 131,072 ขีดจำกัดโทเค็นเอาต์พุต 65,536
ความสามารถ	การสร้างเสียง ไม่รองรับ Batch API สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การรันโค้ด สิ่งที่ทำได้ การใช้คอมพิวเตอร์ สิ่งที่ทำได้ การค้นหาไฟล์ สิ่งที่ทำได้ การอนุมานแบบยืดหยุ่น สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเชื่อมต่อแหล่งข้อมูลกับ Google Maps สิ่งที่ทำได้ การสร้างรูปภาพ ไม่รองรับ Live API ไม่รองรับ การอนุมานตามลำดับความสำคัญ สิ่งที่ทำได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำได้ เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การคิด สิ่งที่ทำได้ บริบท URL สิ่งที่ทำได้
เวอร์ชัน	อ่านรูปแบบเวอร์ชันของโมเดลเพื่อดูรายละเอียดเพิ่มเติม เวอร์ชันตัวอย่าง: `gemini-robotics-er-1.6-preview`
การอัปเดตล่าสุด	ธันวาคม 2025
วันที่สิ้นสุดความรู้	มกราคม 2025