การอ่านออกเสียงข้อความของ Gemini 2.5 Flash

เครื่องมือที่เร็วที่สุดของเราสำหรับการสังเคราะห์เสียงพูดที่มีความสมจริงสูง ซึ่งมีการสร้างเสียงที่มีเวลาในการตอบสนองต่ำและคุ้มค่า Gemini 2.5 Flash TTS เหมาะที่สุดสำหรับผู้ช่วยแบบเรียลไทม์ การบรรยายจำนวนมาก และกรณีการใช้งานแบบสนทนาที่ต้องมีการควบคุมสไตล์และจังหวะของเสียงอย่างละเอียด

เอกสารประกอบ

ดูคำแนะนำเกี่ยวกับ Text-to-Speech เพื่อดูฟีเจอร์และความสามารถทั้งหมด

gemini-2.5-flash-preview-tts

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล gemini-2.5-flash-preview-tts
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

เสียง

ขีดจำกัดโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

8,192

ขีดจำกัดโทเค็นเอาต์พุต

16,384

ความสามารถ

การสร้างเสียง

สิ่งที่ทำได้

การแคช

ไม่รองรับ

การเรียกใช้โค้ด

ไม่รองรับ

การค้นหาไฟล์

สิ่งที่ทำไม่ได้

การเรียกฟังก์ชัน

ไม่รองรับ

การเชื่อมต่อแหล่งข้อมูลกับ Google Maps

ไม่รองรับ

การสร้างรูปภาพ

ไม่รองรับ

Live API

ไม่รองรับ

การเชื่อมต่อแหล่งข้อมูลของ Search

ไม่รองรับ

เอาต์พุตที่มีโครงสร้าง

ไม่รองรับ

การคิด

ไม่รองรับ

บริบท URL

ไม่รองรับ

ตัวเลือกการใช้งาน

Batch API

สิ่งที่ทำได้

การอนุมานแบบยืดหยุ่น

ไม่รองรับ

การอนุมานตามลำดับความสำคัญ

ไม่รองรับ

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • gemini-2.5-flash-preview-tts
การอัปเดตล่าสุด ธันวาคม 2025