Zamiana tekstu na mowę w Gemini 2.5 Pro

Nasz najwyższej jakości silnik do syntezy mowy o jakości studyjnej, który oferuje generowanie dźwięku o wysokiej wierności i zaawansowanych parametrach. Gemini 2.5 Pro TTS najlepiej sprawdza się w przypadku długich treści, profesjonalnych narracji i złożonych procesów twórczych, które wymagają najwyższego poziomu klarowności głosu i naturalnej prozodii.

Dokumentacja

Więcej informacji o funkcjach i możliwościach znajdziesz w przewodniku Text-to-Speech.

gemini-2.5-pro-preview-tts

Właściwość Opis
Kod modelu gemini-2.5-pro-preview-tts
Obsługiwane typy danych

Dane wejściowe

Tekst

Dane wyjściowe

Audio

Limity tokenów[*]

Limit tokenów wejściowych

8192

Limit tokenów wyjściowych

16384

Możliwości

Generowanie dźwięku

Obsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Wykonywanie kodu

Nieobsługiwane

Wyszukiwanie plików

Nieobsługiwane

Wywoływanie funkcji

Nieobsługiwane

Powiązanie ze źródłami informacji przy użyciu Map Google

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Interfejs API na żywo

Nieobsługiwane

Szukaj groundingu

Nieobsługiwane

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Myślę

Nieobsługiwane

Kontekst adresu URL

Nieobsługiwane

Opcje zużycia

Interfejs API wsadowy

Obsługiwane

Wnioskowanie Flex

Nieobsługiwane

Wnioskowanie priorytetowe

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • gemini-2.5-pro-preview-tts
Najnowsza aktualizacja Grudzień 2025 r.