Podgląd na żywo Gemini 2.5 Flash

Interfejs Live API umożliwia interakcje głosowe i wideo w czasie rzeczywistym z niewielkimi opóźnieniami dzięki Gemini 2.5 Flash. Przetwarza on ciągłe strumienie audio, wideo lub tekstu, aby dostarczać natychmiastowe odpowiedzi głosowe przypominające ludzką mowę, co zapewnia użytkownikom naturalny tryb konwersacyjny.

Dokumentacja

Więcej informacji o funkcjach i możliwościach znajdziesz w przewodniku po interfejsie Live API.

gemini-2.5-flash-native-audio-preview-12-2025

Właściwość Opis
Kod modelu gemini-2.5-flash-native-audio-preview-12-2025
Obsługiwane typy danych

Dane wejściowe

Audio, wideo, tekst

Dane wyjściowe

Audio i tekst

Limity tokenów[*]

Limit tokenów wejściowych

131 072

Limit tokenów wyjściowych

8192

Możliwości

Generowanie dźwięku

Obsługiwane

Interfejs Batch API

Nieobsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Wykonywanie kodu

Nieobsługiwane

Wyszukiwanie plików

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Powiązanie ze źródłem informacji przy użyciu Map Google

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Interfejs Live API

Obsługiwane

Szukaj groundingu

Obsługiwane

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Myślę

Obsługiwane

Kontekst adresu URL

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Wersja testowa: gemini-2.5-flash-native-audio-preview-12-2025
Najnowsza aktualizacja Wrzesień 2025 r.
Granica wiedzy Styczeń 2025 r.