Model Gemini 3.1 Flash TTS (wersja testowa) zapewnia zaawansowane generowanie mowy z krótkim czasem oczekiwania i naturalnymi wynikami, sterowane prompty oraz nowe tagi audio, które umożliwiają precyzyjną kontrolę nad narracją.
Dokumentacja
Model Gemini 3.1 Flash TTS (wersja testowa) wprowadza ekspresyjne tagi audio do sterowania narracją, a także ogólne ulepszenia w zakresie naturalności, możliwości sterowania i wielojęzyczności.
Pełny opis funkcji i możliwości znajdziesz w przewodniku Text-to-Speech.
gemini-3.1-flash-tts-preview
| Właściwość | Opis |
|---|---|
| Kod modelu | gemini-3.1-flash-tts-preview |
| Obsługiwane typy danych |
Dane wejściowe Tekst Dane wyjściowe Audio |
| Limity tokenów[*] |
Limit tokenów wejściowych 8192 Limit tokenów wyjściowych 16 384 |
| Uprawnienia | Obsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Nieobsługiwane Nieobsługiwane Nieobsługiwane Powiązanie ze źródłami informacji przy użyciu Map Google Nieobsługiwane Nieobsługiwane Nieobsługiwane Nieobsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Nieobsługiwane Nieobsługiwane |
| Opcje wykorzystania |
Obsługiwane Nieobsługiwane Nieobsługiwane |
| wersje |
|
| Ostatnia aktualizacja | Kwiecień 2026 r. |
| Granica wiedzy | Styczeń 2025 r. |