Nasz najszybszy silnik do syntezy mowy o wysokiej jakości, który zapewnia krótki czas oczekiwania i ekonomiczne generowanie dźwięku. Technologia Gemini 2.5 Flash TTS najlepiej sprawdza się w przypadku asystentów działających w czasie rzeczywistym, narracji o dużej objętości i rozmów, które wymagają precyzyjnej kontroli nad stylem i tempem głosu.
Dokumentacja
Pełny opis funkcji i możliwości znajdziesz w przewodniku Text-to-Speech.
gemini-2.5-flash-preview-tts
| Właściwość | Opis |
|---|---|
| Kod modelu | gemini-2.5-flash-preview-tts |
| Obsługiwane typy danych |
Dane wejściowe Tekst Dane wyjściowe Audio |
| Limity tokenów[*] |
Limit tokenów wejściowych 8192 Limit tokenów wyjściowych 16 384 |
| Uprawnienia | Obsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Nieobsługiwane Nieobsługiwane Nieobsługiwane Powiązanie ze źródłami informacji przy użyciu Map Google Nieobsługiwane Nieobsługiwane Nieobsługiwane Nieobsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Nieobsługiwane Nieobsługiwane |
| Opcje wykorzystania |
Obsługiwane Nieobsługiwane Nieobsługiwane |
| wersje |
|
| Ostatnia aktualizacja | Grudzień 2025 r. |