โมเดล TTS ของ Gemini 3.1 Flash (เวอร์ชันตัวอย่าง) มีการสร้างคำพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ พร้อมเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงที่สื่ออารมณ์ใหม่ เพื่อการควบคุมการบรรยายที่แม่นยำ
เอกสารประกอบ
โมเดล TTS ของ Gemini 3.1 Flash เวอร์ชันตัวอย่างเปิดตัวแท็กเสียง ที่สื่ออารมณ์เพื่อควบคุมการบรรยาย รวมถึงการปรับปรุงโดยรวมด้านความเป็นธรรมชาติ ความสามารถในการควบคุม และความสามารถในการรองรับหลายภาษา
โปรดไปที่คำแนะนำเกี่ยวกับการอ่านออกเสียงข้อความเพื่อดูข้อมูลทั้งหมดเกี่ยวกับฟีเจอร์และความสามารถ
gemini-3.1-flash-tts-preview
| พร็อพเพอร์ตี้ | คำอธิบาย |
|---|---|
| รหัสโมเดล | gemini-3.1-flash-tts-preview |
| ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต เสียง |
| ขีดจำกัดของโทเค็น[*] |
ขีดจำกัดโทเค็นอินพุต 8,192 ขีดจำกัดโทเค็นเอาต์พุต 16,384 |
| ความสามารถ | สิ่งที่ทำได้ สิ่งที่ทำไม่ได้ สิ่งที่ทำไม่ได้ ไม่รองรับ สิ่งที่ทำไม่ได้ การเชื่อมต่อแหล่งข้อมูลกับ Google Maps สิ่งที่ทำไม่ได้ สิ่งที่ทำไม่ได้ สิ่งที่ทำไม่ได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำไม่ได้ สิ่งที่ทำไม่ได้ สิ่งที่ทำไม่ได้ สิ่งที่ทำไม่ได้ |
| ตัวเลือกการรับชม |
สิ่งที่ทำได้ สิ่งที่ทำไม่ได้ สิ่งที่ทำไม่ได้ |
| เวอร์ชัน |
|
| การอัปเดตล่าสุด | เมษายน 2026 |
| การตัดข้อมูล | มกราคม 2025 |