Gemini 3.1 Flash TTS (zamiana tekstu na mowę) – wersja testowa

Model Gemini 3.1 Flash TTS (wersja testowa) zapewnia zaawansowane generowanie mowy z krótkim czasem oczekiwania i naturalnymi wynikami, sterowane prompty oraz nowe tagi audio, które umożliwiają precyzyjną kontrolę nad narracją.

Dokumentacja

Model Gemini 3.1 Flash TTS (wersja testowa) wprowadza ekspresyjne tagi audio do sterowania narracją, a także ogólne ulepszenia w zakresie naturalności, możliwości sterowania i wielojęzyczności.

Pełny opis funkcji i możliwości znajdziesz w przewodniku Text-to-Speech.

gemini-3.1-flash-tts-preview

Właściwość Opis
Kod modelu gemini-3.1-flash-tts-preview
Obsługiwane typy danych

Dane wejściowe

Tekst

Dane wyjściowe

Audio

Limity tokenów[*]

Limit tokenów wejściowych

8192

Limit tokenów wyjściowych

16 384

 Uprawnienia

Generowanie dźwięku

Obsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Wyszukiwanie plików

Nieobsługiwane

Wywoływanie funkcji

Nieobsługiwane

Powiązanie ze źródłami informacji przy użyciu Map Google

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Live API

Nieobsługiwane

Szukaj groundingu

Nieobsługiwane

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Myślenie

Nieobsługiwane

Kontekst adresu URL

Nieobsługiwane

 Opcje wykorzystania

Batch API

Obsługiwane

Elastyczne wnioskowanie

Nieobsługiwane

Priorytet wnioskowania

Nieobsługiwane

 wersje
Więcej informacji znajdziesz w wzorcach wersji modelu.
  • gemini-3.1-flash-tts-preview
Ostatnia aktualizacja Kwiecień 2026 r.
Granica wiedzy Styczeń 2025 r.