Interfejs Live API umożliwia interakcje głosowe i wideo w czasie rzeczywistym z niewielkimi opóźnieniami dzięki Gemini 2.5 Flash. Przetwarza on ciągłe strumienie audio, wideo lub tekstu, aby dostarczać natychmiastowe odpowiedzi głosowe przypominające ludzką mowę, co zapewnia użytkownikom naturalny tryb konwersacyjny.
Dokumentacja
Więcej informacji o funkcjach i możliwościach znajdziesz w przewodniku po interfejsie Live API.
gemini-2.5-flash-native-audio-preview-12-2025
| Właściwość | Opis |
|---|---|
| Kod modelu |
gemini-2.5-flash-native-audio-preview-12-2025
|
| Obsługiwane typy danych |
Dane wejściowe Audio, wideo, tekst Dane wyjściowe Audio i tekst |
| Limity tokenów[*] |
Limit tokenów wejściowych 131 072 Limit tokenów wyjściowych 8192 |
| Możliwości |
Generowanie dźwięku Obsługiwane Interfejs Batch API Nieobsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonywanie kodu Nieobsługiwane Wyszukiwanie plików Nieobsługiwane Wywoływanie funkcji Obsługiwane Powiązanie ze źródłem informacji przy użyciu Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Interfejs Live API Obsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Myślę Obsługiwane Kontekst adresu URL Nieobsługiwane |
| Wersje |
|
| Najnowsza aktualizacja | Wrzesień 2025 r. |
| Granica wiedzy | Styczeń 2025 r. |