เวอร์ชันตัวอย่างของ TTS (การอ่านออกเสียงข้อความ) ของ Gemini 3.1 Flash

โมเดล TTS ของ Gemini 3.1 Flash (เวอร์ชันตัวอย่าง) มีการสร้างคำพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ พร้อมเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงที่สื่ออารมณ์ใหม่ เพื่อการควบคุมการบรรยายที่แม่นยำ

เอกสารประกอบ

โมเดล TTS ของ Gemini 3.1 Flash เวอร์ชันตัวอย่างเปิดตัวแท็กเสียง ที่สื่ออารมณ์เพื่อควบคุมการบรรยาย รวมถึงการปรับปรุงโดยรวมด้านความเป็นธรรมชาติ ความสามารถในการควบคุม และความสามารถในการรองรับหลายภาษา

โปรดไปที่คำแนะนำเกี่ยวกับการอ่านออกเสียงข้อความเพื่อดูข้อมูลทั้งหมดเกี่ยวกับฟีเจอร์และความสามารถ

gemini-3.1-flash-tts-preview

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล gemini-3.1-flash-tts-preview
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

เสียง

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

8,192

ขีดจำกัดโทเค็นเอาต์พุต

16,384

ความสามารถ

การสร้างเสียง

สิ่งที่ทำได้

การแคช

สิ่งที่ทำไม่ได้

การเรียกใช้โค้ด

สิ่งที่ทำไม่ได้

การค้นหาไฟล์

ไม่รองรับ

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำไม่ได้

การเชื่อมต่อแหล่งข้อมูลกับ Google Maps

สิ่งที่ทำไม่ได้

การสร้างรูปภาพ

สิ่งที่ทำไม่ได้

Live API

สิ่งที่ทำไม่ได้

การเชื่อมต่อแหล่งข้อมูลของ Search

สิ่งที่ทำไม่ได้

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำไม่ได้

การคิด

สิ่งที่ทำไม่ได้

บริบทของ URL

สิ่งที่ทำไม่ได้

ตัวเลือกการรับชม

Batch API

สิ่งที่ทำได้

การอนุมานแบบยืดหยุ่น

สิ่งที่ทำไม่ได้

การอนุมานตามลำดับความสำคัญ

สิ่งที่ทำไม่ได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • gemini-3.1-flash-tts-preview
การอัปเดตล่าสุด เมษายน 2026
การตัดข้อมูล มกราคม 2025