โมเดล TTS ของ Gemini 3.1 Flash (เวอร์ชันตัวอย่าง) มีการสร้างคำพูดที่ทรงประสิทธิภาพและมีเวลาในการตอบสนองต่ำ พร้อมเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงที่สื่ออารมณ์ใหม่ สำหรับการควบคุมการบรรยายที่แม่นยำ
เอกสารประกอบ
โมเดล TTS ของ Gemini 3.1 Flash เวอร์ชันตัวอย่างมาพร้อมแท็กเสียง ที่สื่ออารมณ์เพื่อควบคุมการบรรยาย รวมถึงการปรับปรุงโดยรวมด้านความเป็นธรรมชาติ ความสามารถในการควบคุม และความสามารถในการรองรับหลายภาษา
โปรดไปที่คำแนะนำเกี่ยวกับText-to-Speechเพื่อดูข้อมูลทั้งหมดเกี่ยวกับฟีเจอร์และความสามารถ
gemini-3.1-flash-tts-preview
| พร็อพเพอร์ตี้ | คำอธิบาย |
|---|---|
| รหัสโมเดล | gemini-3.1-flash-tts-preview |
| ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต เสียง |
| ขีดจำกัดของโทเค็น[*] |
ขีดจำกัดโทเค็นอินพุต 8,192 ขีดจำกัดโทเค็นเอาต์พุต 16,384 |
| ความสามารถ |
การสร้างเสียง สิ่งที่ทำได้ Batch API สิ่งที่ทำได้ การแคช สิ่งที่ทำไม่ได้ การรันโค้ด สิ่งที่ทำไม่ได้ ค้นหาไฟล์ ไม่รองรับ การเรียกใช้ฟังก์ชัน สิ่งที่ทำไม่ได้ การเชื่อมต่อแหล่งข้อมูลกับ Google Maps สิ่งที่ทำไม่ได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ Live API สิ่งที่ทำไม่ได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำไม่ได้ เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำไม่ได้ การคิด สิ่งที่ทำไม่ได้ บริบทของ URL สิ่งที่ทำไม่ได้ |
| เวอร์ชัน |
|
| การอัปเดตล่าสุด | เมษายน 2026 |
| การตัดข้อมูล | มกราคม 2025 |