Gemini 3.1 Flash Live Preview เป็นโมเดลเสียงต่อเสียงที่มีเวลาในการตอบสนองต่ำ ซึ่งได้รับการปรับให้เหมาะกับบทสนทนาแบบเรียลไทม์และแอปพลิเคชัน AI ที่เน้นเสียงเป็นหลัก โดยมีความสามารถในการตรวจจับความแตกต่างของเสียง ความแม่นยำเชิงตัวเลข และการรับรู้แบบมัลติโมดัล
เอกสารประกอบ
ดูคู่มือ Live API เพื่อดูฟีเจอร์และความสามารถทั้งหมด
gemini-3.1-flash-live-preview
| พร็อพเพอร์ตี้ | คำอธิบาย |
|---|---|
| รหัสโมเดล |
gemini-3.1-flash-live-preview
|
| ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ รูปภาพ เสียง วิดีโอ เอาต์พุต ข้อความและเสียง |
| ขีดจำกัดโทเค็น[*] |
ขีดจำกัดโทเค็นอินพุต 131,072 ขีดจำกัดโทเค็นเอาต์พุต 65,536 |
| ความสามารถ |
สิ่งที่ทำได้ ไม่รองรับ ไม่รองรับ สิ่งที่ทำไม่ได้ สิ่งที่ทำได้ การเชื่อมต่อแหล่งข้อมูลกับ Google Maps ไม่รองรับ ไม่รองรับ สิ่งที่ทำได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำได้ ไม่รองรับ สิ่งที่ทำได้ ไม่รองรับ |
| ตัวเลือกการใช้งาน |
ไม่รองรับ |
| เวอร์ชัน |
|
| การอัปเดตล่าสุด | มีนาคม 2026 |
| ขีดจำกัดความรู้ | มกราคม 2025 |
การย้ายข้อมูลจาก Gemini 2.5 Flash Live
Gemini 3.1 Flash Live Preview ได้รับการปรับให้เหมาะกับบทสนทนาแบบเรียลไทม์ที่มีเวลาในการตอบสนองต่ำ
เมื่อย้ายข้อมูลจาก gemini-2.5-flash-native-audio-preview-12-2025 โปรดคำนึงถึงสิ่งต่อไปนี้
- สตริงโมเดล: อัปเดตสตริงโมเดลจาก
gemini-2.5-flash-native-audio-preview-12-2025เป็นgemini-3.1-flash-live-preview - การกำหนดค่าการคิด: Gemini 3.1 ใช้
thinkingLevel(มีการตั้งค่า เช่นminimal,low,medium, และhigh) แทนthinkingBudgetค่าเริ่มต้นคือminimalเพื่อเพิ่มประสิทธิภาพให้มีเวลาในการตอบสนองต่ำที่สุด ดู ระดับและงบประมาณการคิด - เหตุการณ์ของเซิร์ฟเวอร์: ตอนนี้เหตุการณ์
BidiGenerateContentServerContentรายการเดียวสามารถมีเนื้อหาหลายส่วนพร้อมกันได้ (เช่น เสียงและข้อความถอดเสียง) อัปเดตโค้ดเพื่อประมวลผลทุกส่วนในแต่ละเหตุการณ์เพื่อหลีกเลี่ยงการพลาดเนื้อหา - เนื้อหาของไคลเอ็นต์:
send_client_contentรองรับสำหรับการเริ่มต้น ประวัติบริบทเริ่มต้นเท่านั้น (ต้องตั้งค่าinitial_history_in_client_contentในhistory_config) ใช้send_realtime_inputเพื่อส่ง การอัปเดตข้อความระหว่างการสนทนา ดู การอัปเดตเนื้อหาแบบเพิ่มทีละส่วน - ความครอบคลุมของเทิร์น: ค่าเริ่มต้นคือ
TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOแทนTURN_INCLUDES_ONLY_ACTIVITYตอนนี้เทิร์นของโมเดลรวมกิจกรรมเสียงที่ตรวจพบและเฟรมวิดีโอทั้งหมด หากแอปพลิเคชันของคุณส่งสตรีมเฟรมวิดีโออย่างต่อเนื่องในปัจจุบัน คุณอาจต้องการอัปเดตแอปพลิเคชันให้ส่งเฟรมวิดีโอเฉพาะเมื่อมีกิจกรรมเสียงเพื่อหลีกเลี่ยงค่าใช้จ่ายเพิ่มเติม - การเรียกฟังก์ชันแบบอะซิงโครนัส: ยังไม่รองรับ การเรียกฟังก์ชันเป็นแบบซิงโครนัสเท่านั้น โมเดลจะไม่เริ่มตอบกลับจนกว่าคุณจะส่งการตอบกลับของเครื่องมือ ดู การเรียกใช้ฟังก์ชันแบบไม่พร้อมกัน
- เสียงเชิงรุกและบทสนทนาเชิงอารมณ์: ฟีเจอร์เหล่านี้ยังไม่ รองรับใน Gemini 3.1 Flash Live นำการกำหนดค่าสำหรับฟีเจอร์เหล่านี้ออกจากโค้ด ดู เสียงเชิงรุกและ บทสนทนาเชิงอารมณ์
ดูการเปรียบเทียบฟีเจอร์แบบละเอียดได้ที่ ตารางการเปรียบเทียบรูปแบบการระบุแหล่งที่มาใน คู่มือความสามารถ