โมเดล Gemini 3.1 Flash TTS Preview มีฟีเจอร์การสร้างคำพูดที่ทรงประสิทธิภาพและมีความหน่วงต่ำ พร้อมเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงแบบใหม่ที่แสดงอารมณ์ได้หลากหลายเพื่อการควบคุมการบรรยายที่แม่นยำ
เอกสารประกอบ
โมเดล Gemini 3.1 Flash TTS Preview มาพร้อมแท็กเสียง ที่แสดงอารมณ์ได้หลากหลายเพื่อควบคุมการบรรยาย รวมถึงการปรับปรุงโดยรวมในด้านความเป็นธรรมชาติ ความสามารถในการควบคุม และความสามารถในการรองรับหลายภาษา
ดูฟีเจอร์และความสามารถทั้งหมดได้ที่คู่มือ Text-to-Speech
gemini-3.1-flash-tts-preview
| พร็อพเพอร์ตี้ | คำอธิบาย |
|---|---|
| รหัสโมเดล | gemini-3.1-flash-tts-preview |
| ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต เสียง |
| ขีดจำกัดโทเค็น[*] |
ขีดจำกัดโทเค็นอินพุต 8,192 ขีดจำกัดโทเค็นเอาต์พุต 16,384 |
| ความสามารถ |
การสร้างเสียง สิ่งที่ทำได้ Batch API สิ่งที่ทำได้ การแคช ไม่รองรับ การรันโค้ด ไม่รองรับ การค้นหาไฟล์ สิ่งที่ทำไม่ได้ การเรียกฟังก์ชัน ไม่รองรับ การเชื่อมต่อแหล่งข้อมูลกับ Google Maps ไม่รองรับ การสร้างรูปภาพ ไม่รองรับ Live API ไม่รองรับ การเชื่อมต่อแหล่งข้อมูลของ Search ไม่รองรับ เอาต์พุตที่มีโครงสร้าง ไม่รองรับ การคิด ไม่รองรับ บริบท URL ไม่รองรับ |
| เวอร์ชัน |
|
| การอัปเดตล่าสุด | เมษายน 2026 |
| วันที่สิ้นสุดข้อมูล | มกราคม 2025 |