การอ่านออกเสียงข้อความของ Gemini 2.5 Flash

เครื่องมือที่เร็วที่สุดของเราสำหรับการสังเคราะห์เสียงพูดที่มีความสมจริงสูง โดยมีการหน่วงเวลาต่ำและการสร้างเสียงที่มีประสิทธิภาพด้านต้นทุน Gemini 2.5 Flash TTS เหมาะที่สุดสำหรับผู้ช่วยแบบเรียลไทม์ การบรรยายจำนวนมาก และกรณีการใช้งานแบบสนทนาที่ต้องมีการควบคุมสไตล์และจังหวะของเสียงอย่างละเอียด

เอกสารประกอบ

ดูคำแนะนำเกี่ยวกับ Text-to-Speech เพื่อดูฟีเจอร์และความสามารถทั้งหมด

gemini-2.5-flash-preview-tts

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล gemini-2.5-flash-preview-tts
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

เสียง

ขีดจำกัดโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

8,192

ขีดจำกัดโทเค็นเอาต์พุต

16,384

ความสามารถ

การสร้างเสียง

สิ่งที่ทำได้

Batch API

สิ่งที่ทำได้

การแคช

ไม่รองรับ

การรันโค้ด

ไม่รองรับ

การค้นหาไฟล์

สิ่งที่ทำไม่ได้

การเรียกฟังก์ชัน

ไม่รองรับ

การเชื่อมต่อแหล่งข้อมูลกับ Google Maps

ไม่รองรับ

การสร้างรูปภาพ

ไม่รองรับ

Live API

ไม่รองรับ

การเชื่อมต่อแหล่งข้อมูลของ Search

ไม่รองรับ

เอาต์พุตที่มีโครงสร้าง

ไม่รองรับ

การคิด

ไม่รองรับ

บริบท URL

ไม่รองรับ

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมเกี่ยวกับรูปแบบเวอร์ชันของโมเดล
  • gemini-2.5-flash-preview-tts
การอัปเดตล่าสุด ธันวาคม 2025