Model Gemini 3.1 Flash TTS Preview zapewnia zaawansowane generowanie mowy o krótkim czasie oczekiwania z naturalnymi wynikami, sterowanymi promptami i nowymi tagami audio, które umożliwiają precyzyjną kontrolę nad narracją.
Dokumentacja
Model Gemini 3.1 Flash TTS (wersja testowa) wprowadza ekspresyjne tagi audio do sterowania narracją, a także ogólne ulepszenia w zakresie naturalności, możliwości sterowania i wielojęzyczności.
Pełny opis funkcji i możliwości znajdziesz w przewodniku Text-to-Speech.
gemini-3.1-flash-tts-preview
| Właściwość | Opis |
|---|---|
| Kod modelu | gemini-3.1-flash-tts-preview |
| Obsługiwane typy danych |
Dane wejściowe Tekst Dane wyjściowe Audio |
| Limity tokenów[*] |
Limit tokenów wejściowych 8192 Limit tokenów wyjściowych 16 384 |
| Uprawnienia |
Generowanie dźwięku Obsługiwane Batch API Obsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwanie plików Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Powiązanie ze źródłem informacji przy użyciu Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Live API Nieobsługiwane Szukaj groundingu Nieobsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Myślenie Nieobsługiwane Kontekst adresu URL Nieobsługiwane |
| Wersje |
|
| Ostatnia aktualizacja | Kwiecień 2026 r. |
| Granica wiedzy | Styczeń 2025 r. |