Interfejs Live API umożliwia interakcje głosowe i wideo w czasie rzeczywistym z niewielkimi opóźnieniami przy użyciu Gemini 2.5 Flash. Przetwarza ciągłe strumienie audio, wideo lub tekstu, aby dostarczać natychmiastowe, podobne do ludzkich odpowiedzi głosowe, tworząc naturalny tryb konwersacyjny dla użytkowników.
Dokumentacja
Więcej informacji o funkcjach i możliwościach znajdziesz w przewodniku po interfejsie Live API.
gemini-2.5-flash-native-audio-preview-12-2025
| Właściwość | Opis |
|---|---|
| Kod modelu |
gemini-2.5-flash-native-audio-preview-12-2025
|
| Obsługiwane typy danych |
Dane wejściowe Audio, wideo, tekst Dane wyjściowe Dźwięk i tekst |
| Limity tokenów[*] |
Limit tokenów wejściowych 131 072 Limit tokenów wyjściowych 8192 |
| Uprawnienia |
Generowanie dźwięku Obsługiwane Batch API Nieobsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwanie plików Nieobsługiwane Wywoływanie funkcji Obsługiwane Powiązanie ze źródłem informacji przy użyciu Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Live API Obsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Myślenie Obsługiwane Kontekst adresu URL Nieobsługiwane |
| Wersje |
|
| Ostatnia aktualizacja | Wrzesień 2025 r. |
| Granica wiedzy | Styczeń 2025 r. |