Gemini 3.1 Flash TTS Preview 모델은 자연스러운 출력, 조작 가능한 프롬프트, 정확한 내레이션 제어를 위한 새로운 표현 오디오 태그를 통해 강력하고 지연 시간이 짧은 음성 생성을 제공합니다.
문서
Gemini 3.1 Flash TTS Preview 모델은 내레이션을 제어하기 위한 표현 오디오 태그 와 자연스러움, 제어 가능성, 다국어 지원을 전반적으로 개선합니다.
기능 및 기능에 대한 전체 내용은 텍스트 음성 변환 가이드를 참고하세요.
gemini-3.1-flash-tts-preview
| 속성 | 설명 |
|---|---|
| 모델 코드 | gemini-3.1-flash-tts-preview |
| 지원되는 데이터 유형 |
입력 텍스트 출력 오디오 |
| 토큰 한도[*] |
입력 토큰 한도 8,192 출력 토큰 한도 16,384 |
| 기능 |
오디오 생성 지원됨 Batch API 지원됨 캐싱 지원되지 않음 코드 실행 지원되지 않음 파일 검색 지원되지 않음 함수 호출 지원되지 않음 Google 지도 그라운딩 지원되지 않음 이미지 생성 지원되지 않음 Live API 지원되지 않음 검색 그라운딩 지원되지 않음 구조화된 출력 지원되지 않음 사고 지원되지 않음 URL 컨텍스트 지원되지 않음 |
| 버전 |
|
| 최신 업데이트 | 2026년 4월 |
| 지식 단절 | 2025년 1월 |