เวอร์ชันตัวอย่างของ TTS (การอ่านออกเสียงข้อความ) ของ Gemini 3.1 Flash

โมเดล Gemini 3.1 Flash TTS Preview มีฟีเจอร์การสร้างคำพูดที่ทรงประสิทธิภาพและมีความหน่วงต่ำ พร้อมเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงแบบใหม่ที่แสดงอารมณ์ได้หลากหลายเพื่อการควบคุมการบรรยายที่แม่นยำ

เอกสารประกอบ

โมเดล Gemini 3.1 Flash TTS Preview มาพร้อมแท็กเสียง ที่แสดงอารมณ์ได้หลากหลายเพื่อควบคุมการบรรยาย รวมถึงการปรับปรุงโดยรวมในด้านความเป็นธรรมชาติ ความสามารถในการควบคุม และความสามารถในการรองรับหลายภาษา

ดูฟีเจอร์และความสามารถทั้งหมดได้ที่คู่มือ Text-to-Speech

gemini-3.1-flash-tts-preview

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล gemini-3.1-flash-tts-preview
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

เสียง

ขีดจำกัดโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

8,192

ขีดจำกัดโทเค็นเอาต์พุต

16,384

ความสามารถ

การสร้างเสียง

สิ่งที่ทำได้

Batch API

สิ่งที่ทำได้

การแคช

ไม่รองรับ

การรันโค้ด

ไม่รองรับ

การค้นหาไฟล์

สิ่งที่ทำไม่ได้

การเรียกฟังก์ชัน

ไม่รองรับ

การเชื่อมต่อแหล่งข้อมูลกับ Google Maps

ไม่รองรับ

การสร้างรูปภาพ

ไม่รองรับ

Live API

ไม่รองรับ

การเชื่อมต่อแหล่งข้อมูลของ Search

ไม่รองรับ

เอาต์พุตที่มีโครงสร้าง

ไม่รองรับ

การคิด

ไม่รองรับ

บริบท URL

ไม่รองรับ

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมเกี่ยวกับรูปแบบเวอร์ชันของโมเดล
  • gemini-3.1-flash-tts-preview
การอัปเดตล่าสุด เมษายน 2026
วันที่สิ้นสุดข้อมูล มกราคม 2025