เวอร์ชันตัวอย่างของ TTS (การอ่านออกเสียงข้อความ) ของ Gemini 3.1 Flash

โมเดล TTS ของ Gemini 3.1 Flash (เวอร์ชันตัวอย่าง) มีการสร้างคำพูดที่ทรงประสิทธิภาพและมีเวลาในการตอบสนองต่ำ พร้อมเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงที่สื่ออารมณ์ใหม่ สำหรับการควบคุมการบรรยายที่แม่นยำ

เอกสารประกอบ

โมเดล TTS ของ Gemini 3.1 Flash เวอร์ชันตัวอย่างมาพร้อมแท็กเสียง ที่สื่ออารมณ์เพื่อควบคุมการบรรยาย รวมถึงการปรับปรุงโดยรวมด้านความเป็นธรรมชาติ ความสามารถในการควบคุม และความสามารถในการรองรับหลายภาษา

โปรดไปที่คำแนะนำเกี่ยวกับText-to-Speechเพื่อดูข้อมูลทั้งหมดเกี่ยวกับฟีเจอร์และความสามารถ

gemini-3.1-flash-tts-preview

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล gemini-3.1-flash-tts-preview
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

เสียง

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

8,192

ขีดจำกัดโทเค็นเอาต์พุต

16,384

ความสามารถ

การสร้างเสียง

สิ่งที่ทำได้

Batch API

สิ่งที่ทำได้

การแคช

สิ่งที่ทำไม่ได้

การรันโค้ด

สิ่งที่ทำไม่ได้

ค้นหาไฟล์

ไม่รองรับ

การเรียกใช้ฟังก์ชัน

สิ่งที่ทำไม่ได้

การเชื่อมต่อแหล่งข้อมูลกับ Google Maps

สิ่งที่ทำไม่ได้

การสร้างรูปภาพ

สิ่งที่ทำไม่ได้

Live API

สิ่งที่ทำไม่ได้

การเชื่อมต่อแหล่งข้อมูลของ Search

สิ่งที่ทำไม่ได้

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำไม่ได้

การคิด

สิ่งที่ทำไม่ได้

บริบทของ URL

สิ่งที่ทำไม่ได้

เวอร์ชัน
อ่านรายละเอียดเพิ่มเติมได้ในรูปแบบเวอร์ชันของโมเดล
  • gemini-3.1-flash-tts-preview
การอัปเดตล่าสุด เมษายน 2026
การตัดข้อมูล มกราคม 2025