Interfejs Interactions API jest już ogólnie dostępny. Zalecamy korzystanie z tego interfejsu API, aby mieć dostęp do wszystkich najnowszych funkcji i modeli.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Zamiana tekstu na mowę w Gemini 2.5 Pro

Nasz najwyższej jakości silnik do syntezy mowy o jakości studyjnej, który oferuje generowanie dźwięku o wysokiej wierności i zaawansowanych parametrach. Gemini 2.5 Pro TTS najlepiej sprawdza się w przypadku długich treści, profesjonalnych narracji i złożonych procesów twórczych, które wymagają najwyższego poziomu klarowności głosu i naturalnej prozodii.

Wypróbuj w Google AI Studio

Dokumentacja

Więcej informacji o funkcjach i możliwościach znajdziesz w przewodniku Text-to-Speech.

gemini-2.5-pro-preview-tts

Właściwość	Opis
Kod modelu	`gemini-2.5-pro-preview-tts`
Obsługiwane typy danych	Dane wejściowe Tekst Dane wyjściowe Audio
Limity tokenów^[*]	Limit tokenów wejściowych 8192 Limit tokenów wyjściowych 16384
Możliwości	Generowanie dźwięku Obsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonywanie kodu Nieobsługiwane Wyszukiwanie plików Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Powiązanie ze źródłami informacji przy użyciu Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Interfejs API na żywo Nieobsługiwane Szukaj groundingu Nieobsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Myślę Nieobsługiwane Kontekst adresu URL Nieobsługiwane
Opcje zużycia	Interfejs API wsadowy Obsługiwane Wnioskowanie Flex Nieobsługiwane Wnioskowanie priorytetowe Nieobsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. `gemini-2.5-pro-preview-tts`
Najnowsza aktualizacja	Grudzień 2025 r.