Nasz najszybszy silnik do syntezy mowy o wysokiej jakości, który zapewnia niskie opóźnienia i ekonomiczne generowanie dźwięku. Technologia Gemini 2.5 Flash TTS najlepiej sprawdza się w przypadku asystentów działających w czasie rzeczywistym, narracji o dużej objętości i rozmów, które wymagają precyzyjnej kontroli nad stylem i tempem głosu.
Dokumentacja
Pełny opis funkcji i możliwości znajdziesz w przewodniku Text-to-Speech.
gemini-2.5-flash-preview-tts
| Właściwość | Opis |
|---|---|
| Kod modelu | gemini-2.5-flash-preview-tts |
| Obsługiwane typy danych |
Dane wejściowe Tekst Dane wyjściowe Audio |
| Limity tokenów[*] |
Limit tokenów wejściowych 8192 Limit tokenów wyjściowych 16 384 |
| Uprawnienia |
Generowanie dźwięku Obsługiwane Batch API Obsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwanie plików Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Grounding z użyciem Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Live API Nieobsługiwane Szukaj groundingu Nieobsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Myślenie Nieobsługiwane Kontekst adresu URL Nieobsługiwane |
| Wersje |
|
| Ostatnia aktualizacja | Grudzień 2025 r. |