Interfejs Interactions API jest już ogólnie dostępny. Zalecamy korzystanie z tego interfejsu API, aby mieć dostęp do wszystkich najnowszych funkcji i modeli.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Zamiana tekstu na mowę w Gemini 2.5 Flash

Nasz najszybszy silnik do syntezy mowy o wysokiej jakości, który zapewnia krótki czas oczekiwania i ekonomiczne generowanie dźwięku. Technologia Gemini 2.5 Flash TTS najlepiej sprawdza się w przypadku asystentów działających w czasie rzeczywistym, narracji o dużej objętości i rozmów, które wymagają precyzyjnej kontroli nad stylem i tempem głosu.

Wypróbuj w Google AI Studio

Dokumentacja

Pełny opis funkcji i możliwości znajdziesz w przewodniku Text-to-Speech.

gemini-2.5-flash-preview-tts

Właściwość	Opis
Kod modelu	`gemini-2.5-flash-preview-tts`
Obsługiwane typy danych	Dane wejściowe Tekst Dane wyjściowe Audio
Limity tokenów^[*]	Limit tokenów wejściowych 8192 Limit tokenów wyjściowych 16 384
Uprawnienia	Generowanie dźwięku Obsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwanie plików Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Powiązanie ze źródłami informacji przy użyciu Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Live API Nieobsługiwane Szukaj groundingu Nieobsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Myślenie Nieobsługiwane Kontekst adresu URL Nieobsługiwane
Opcje wykorzystania	Batch API Obsługiwane Elastyczne wnioskowanie Nieobsługiwane Priorytet wnioskowania Nieobsługiwane
wersje	Więcej informacji znajdziesz w wzorcach wersji modelu. `gemini-2.5-flash-preview-tts`
Ostatnia aktualizacja	Grudzień 2025 r.