Interfejs Interactions API jest już ogólnie dostępny. Zalecamy korzystanie z tego interfejsu API, aby mieć dostęp do wszystkich najnowszych funkcji i modeli.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini 3.1 Flash TTS (zamiana tekstu na mowę) – wersja testowa

Model Gemini 3.1 Flash TTS (wersja testowa) zapewnia zaawansowane generowanie mowy z krótkim czasem oczekiwania i naturalnymi wynikami, sterowane prompty oraz nowe tagi audio, które umożliwiają precyzyjną kontrolę nad narracją.

Wypróbuj w Google AI Studio

Dokumentacja

Model Gemini 3.1 Flash TTS (wersja testowa) wprowadza ekspresyjne tagi audio do sterowania narracją, a także ogólne ulepszenia w zakresie naturalności, możliwości sterowania i wielojęzyczności.

Pełny opis funkcji i możliwości znajdziesz w przewodniku Text-to-Speech.

gemini-3.1-flash-tts-preview

Właściwość	Opis
Kod modelu	`gemini-3.1-flash-tts-preview`
Obsługiwane typy danych	Dane wejściowe Tekst Dane wyjściowe Audio
Limity tokenów^[*]	Limit tokenów wejściowych 8192 Limit tokenów wyjściowych 16 384
Uprawnienia	Generowanie dźwięku Obsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwanie plików Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Powiązanie ze źródłami informacji przy użyciu Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Live API Nieobsługiwane Szukaj groundingu Nieobsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Myślenie Nieobsługiwane Kontekst adresu URL Nieobsługiwane
Opcje wykorzystania	Batch API Obsługiwane Elastyczne wnioskowanie Nieobsługiwane Priorytet wnioskowania Nieobsługiwane
wersje	Więcej informacji znajdziesz w wzorcach wersji modelu. `gemini-3.1-flash-tts-preview`
Ostatnia aktualizacja	Kwiecień 2026 r.
Granica wiedzy	Styczeń 2025 r.