Zamiana tekstu na mowę w Gemini 2.5 Flash

Nasz najszybszy silnik do syntezy mowy o wysokiej jakości, który zapewnia niskie opóźnienia i ekonomiczne generowanie dźwięku. Technologia Gemini 2.5 Flash TTS najlepiej sprawdza się w przypadku asystentów działających w czasie rzeczywistym, narracji o dużej objętości i rozmów, które wymagają precyzyjnej kontroli nad stylem i tempem głosu.

Dokumentacja

Pełny opis funkcji i możliwości znajdziesz w przewodniku Text-to-Speech.

gemini-2.5-flash-preview-tts

Właściwość Opis
Kod modelu gemini-2.5-flash-preview-tts
Obsługiwane typy danych

Dane wejściowe

Tekst

Dane wyjściowe

Audio

Limity tokenów[*]

Limit tokenów wejściowych

8192

Limit tokenów wyjściowych

16 384

Uprawnienia

Generowanie dźwięku

Obsługiwane

Batch API

Obsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Wyszukiwanie plików

Nieobsługiwane

Wywoływanie funkcji

Nieobsługiwane

Grounding z użyciem Map Google

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Live API

Nieobsługiwane

Szukaj groundingu

Nieobsługiwane

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Myślenie

Nieobsługiwane

Kontekst adresu URL

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w wzorcach wersji modelu.
  • gemini-2.5-flash-preview-tts
Ostatnia aktualizacja Grudzień 2025 r.