Interfejs Live API umożliwia interakcje z użyciem głosu i wideo w czasie rzeczywistym z niewielkimi opóźnieniami dzięki Gemini 2.5 Flash. Przetwarza ciągłe strumienie audio, wideo lub tekstu, aby dostarczać natychmiastowe odpowiedzi głosowe, które brzmią jak ludzkie, tworząc naturalne doświadczenie konwersacyjne dla użytkowników.
Dokumentacja
Więcej informacji o funkcjach i możliwościach znajdziesz w przewodniku po interfejsie Live API.
gemini-2.5-flash-native-audio-preview-12-2025
| Właściwość | Opis |
|---|---|
| Kod modelu |
gemini-2.5-flash-native-audio-preview-12-2025
|
| Obsługiwane typy danych |
Dane wejściowe Audio, wideo, tekst Dane wyjściowe Dźwięk i tekst |
| Limity tokenów[*] |
Limit tokenów wejściowych 131 072 Limit tokenów wyjściowych 8192 |
| Uprawnienia |
Generowanie dźwięku Obsługiwane Batch API Nieobsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwanie plików Nieobsługiwane Wywoływanie funkcji Obsługiwane Grounding z użyciem Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Live API Obsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Myślenie Obsługiwane Kontekst adresu URL Nieobsługiwane |
| Wersje |
|
| Ostatnia aktualizacja | Wrzesień 2025 r. |
| Granica wiedzy | Styczeń 2025 r. |