เครื่องมือที่เร็วที่สุดของเราสำหรับการสังเคราะห์เสียงพูดที่มีความสมจริงสูง โดยมีการหน่วงเวลาต่ำและการสร้างเสียงที่มีประสิทธิภาพด้านต้นทุน Gemini 2.5 Flash TTS เหมาะที่สุดสำหรับผู้ช่วยแบบเรียลไทม์ การบรรยายจำนวนมาก และกรณีการใช้งานแบบสนทนาที่ต้องมีการควบคุมสไตล์และจังหวะของเสียงอย่างละเอียด
เอกสารประกอบ
ดูคำแนะนำเกี่ยวกับ Text-to-Speech เพื่อดูฟีเจอร์และความสามารถทั้งหมด
gemini-2.5-flash-preview-tts
| พร็อพเพอร์ตี้ | คำอธิบาย |
|---|---|
| รหัสโมเดล | gemini-2.5-flash-preview-tts |
| ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต เสียง |
| ขีดจำกัดโทเค็น[*] |
ขีดจำกัดโทเค็นอินพุต 8,192 ขีดจำกัดโทเค็นเอาต์พุต 16,384 |
| ความสามารถ |
การสร้างเสียง สิ่งที่ทำได้ Batch API สิ่งที่ทำได้ การแคช ไม่รองรับ การรันโค้ด ไม่รองรับ การค้นหาไฟล์ สิ่งที่ทำไม่ได้ การเรียกฟังก์ชัน ไม่รองรับ การเชื่อมต่อแหล่งข้อมูลกับ Google Maps ไม่รองรับ การสร้างรูปภาพ ไม่รองรับ Live API ไม่รองรับ การเชื่อมต่อแหล่งข้อมูลของ Search ไม่รองรับ เอาต์พุตที่มีโครงสร้าง ไม่รองรับ การคิด ไม่รองรับ บริบท URL ไม่รองรับ |
| เวอร์ชัน |
|
| การอัปเดตล่าสุด | ธันวาคม 2025 |