Nasz najszybszy silnik do syntezy mowy o wysokiej jakości, który zapewnia generowanie dźwięku z niskim opóźnieniem i niskimi kosztami. Gemini 2.5 Flash TTS najlepiej sprawdza się w przypadku asystentów działających w czasie rzeczywistym, narracji o dużej objętości i przypadków użycia konwersacji, które wymagają precyzyjnej kontroli nad stylem i tempem głosu.
Dokumentacja
Aby uzyskać pełne informacje o funkcjach i możliwościach, zapoznaj się z przewodnikiem Text-to-Speech.
gemini-2.5-flash-preview-tts
| Właściwość | Opis |
|---|---|
| Kod modelu | gemini-2.5-flash-preview-tts |
| Obsługiwane typy danych |
Dane wejściowe Tekst Dane wyjściowe Audio |
| Limity tokenów[*] |
Limit tokenów wejściowych 8192 Limit tokenów wyjściowych 16384 |
| Możliwości |
Generowanie dźwięku Obsługiwane Interfejs Batch API Obsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonywanie kodu Nieobsługiwane Wyszukiwanie plików Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Powiązanie ze źródłem informacji przy użyciu Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Interfejs Live API Nieobsługiwane Szukaj groundingu Nieobsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Myślę Nieobsługiwane Kontekst adresu URL Nieobsługiwane |
| Wersje |
|
| Najnowsza aktualizacja | Grudzień 2025 r. |