Zamiana tekstu na mowę w Gemini 2.5 Pro

Nasz silnik premium do syntezy mowy o jakości studyjnej, który zapewnia wysoką wierność i zaawansowane generowanie dźwięku. Gemini 2.5 Pro TTS najlepiej sprawdza się w przypadku długich treści, profesjonalnych narracji i złożonych przepływów pracy, które wymagają najwyższej jakości dźwięku i naturalnej prozodii.

Dokumentacja

Pełny opis funkcji i możliwości znajdziesz w przewodniku Text-to-Speech.

gemini-2.5-pro-preview-tts

Właściwość Opis
Kod modelu gemini-2.5-pro-preview-tts
Obsługiwane typy danych

Dane wejściowe

Tekst

Dane wyjściowe

Audio

Limity tokenów[*]

Limit tokenów wejściowych

8192

Limit tokenów wyjściowych

16 384

Uprawnienia

Generowanie dźwięku

Obsługiwane

Batch API

Obsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Wyszukiwanie plików

Nieobsługiwane

Wywoływanie funkcji

Nieobsługiwane

Grounding z użyciem Map Google

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Live API

Nieobsługiwane

Szukaj groundingu

Nieobsługiwane

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Myślenie

Nieobsługiwane

Kontekst adresu URL

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w wzorcach wersji modelu.
  • gemini-2.5-pro-preview-tts
Ostatnia aktualizacja Grudzień 2025 r.