Zamiana tekstu na mowę w Gemini 2.5 Pro

Nasz silnik premium do syntezy mowy o jakości studyjnej, który zapewnia wysoką wierność i zaawansowane generowanie dźwięku. Technologia Gemini 2.5 Pro TTS najlepiej sprawdza się w przypadku długich treści, profesjonalnych narracji i złożonych przepływów pracy, które wymagają najwyższej jakości dźwięku i naturalnej prozodii.

Dokumentacja

Pełny opis funkcji i możliwości znajdziesz w przewodniku Text-to-Speech.

gemini-2.5-pro-preview-tts

Właściwość Opis
Kod modelu gemini-2.5-pro-preview-tts
Obsługiwane typy danych

Dane wejściowe

Tekst

Dane wyjściowe

Audio

Limity tokenów[*]

Limit tokenów wejściowych

8192

Limit tokenów wyjściowych

16 384

Uprawnienia

Generowanie dźwięku

Obsługiwane

Batch API

Obsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Wyszukiwanie plików

Nieobsługiwane

Wywoływanie funkcji

Nieobsługiwane

Powiązanie ze źródłem informacji przy użyciu Map Google

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Live API

Nieobsługiwane

Szukaj groundingu

Nieobsługiwane

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Myślenie

Nieobsługiwane

Kontekst adresu URL

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w wzorcach wersji modelu.
  • gemini-2.5-pro-preview-tts
Ostatnia aktualizacja Grudzień 2025 r.