ตอนนี้ Interactions API พร้อมให้บริการแก่ผู้ใช้ทั่วไปแล้ว เราขอแนะนำให้ใช้ API นี้เพื่อเข้าถึงฟีเจอร์และโมเดลล่าสุดทั้งหมด

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

เวอร์ชันตัวอย่างของ TTS (การอ่านออกเสียงข้อความ) ของ Gemini 3.1 Flash

โมเดล TTS ของ Gemini 3.1 Flash (เวอร์ชันตัวอย่าง) มีการสร้างคำพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ พร้อมเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงที่สื่ออารมณ์ใหม่ เพื่อการควบคุมการบรรยายที่แม่นยำ

ลองใช้ใน Google AI Studio

เอกสารประกอบ

โมเดล TTS ของ Gemini 3.1 Flash เวอร์ชันตัวอย่างเปิดตัวแท็กเสียง ที่สื่ออารมณ์เพื่อควบคุมการบรรยาย รวมถึงการปรับปรุงโดยรวมด้านความเป็นธรรมชาติ ความสามารถในการควบคุม และความสามารถในการรองรับหลายภาษา

โปรดไปที่คำแนะนำเกี่ยวกับการอ่านออกเสียงข้อความเพื่อดูข้อมูลทั้งหมดเกี่ยวกับฟีเจอร์และความสามารถ

gemini-3.1-flash-tts-preview

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	`gemini-3.1-flash-tts-preview`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ เอาต์พุต เสียง
ขีดจำกัดของโทเค็น^[*]	ขีดจำกัดโทเค็นอินพุต 8,192 ขีดจำกัดโทเค็นเอาต์พุต 16,384
ความสามารถ	การสร้างเสียง สิ่งที่ทำได้ การแคช สิ่งที่ทำไม่ได้ การเรียกใช้โค้ด สิ่งที่ทำไม่ได้ การค้นหาไฟล์ ไม่รองรับ การเรียกใช้ฟังก์ชัน สิ่งที่ทำไม่ได้ การเชื่อมต่อแหล่งข้อมูลกับ Google Maps สิ่งที่ทำไม่ได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ Live API สิ่งที่ทำไม่ได้ การเชื่อมต่อแหล่งข้อมูลของ Search สิ่งที่ทำไม่ได้ เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำไม่ได้ การคิด สิ่งที่ทำไม่ได้ บริบทของ URL สิ่งที่ทำไม่ได้
ตัวเลือกการรับชม	Batch API สิ่งที่ทำได้ การอนุมานแบบยืดหยุ่น สิ่งที่ทำไม่ได้ การอนุมานตามลำดับความสำคัญ สิ่งที่ทำไม่ได้
เวอร์ชัน	อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล `gemini-3.1-flash-tts-preview`
การอัปเดตล่าสุด	เมษายน 2026
การตัดข้อมูล	มกราคม 2025