Podgląd na żywo Gemini 2.5 Flash

Interfejs Live API umożliwia interakcje głosowe i wideo w czasie rzeczywistym z niewielkimi opóźnieniami przy użyciu Gemini 2.5 Flash. Przetwarza ciągłe strumienie audio, wideo lub tekstu, aby dostarczać natychmiastowe, podobne do ludzkich odpowiedzi głosowe, tworząc naturalny tryb konwersacyjny dla użytkowników.

Dokumentacja

Więcej informacji o funkcjach i możliwościach znajdziesz w przewodniku po interfejsie Live API.

gemini-2.5-flash-native-audio-preview-12-2025

Właściwość Opis
Kod modelu gemini-2.5-flash-native-audio-preview-12-2025
Obsługiwane typy danych

Dane wejściowe

Audio, wideo, tekst

Dane wyjściowe

Dźwięk i tekst

Limity tokenów[*]

Limit tokenów wejściowych

131 072

Limit tokenów wyjściowych

8192

Uprawnienia

Generowanie dźwięku

Obsługiwane

Batch API

Nieobsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Wyszukiwanie plików

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Powiązanie ze źródłem informacji przy użyciu Map Google

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Live API

Obsługiwane

Szukaj groundingu

Obsługiwane

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Myślenie

Obsługiwane

Kontekst adresu URL

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w wzorcach wersji modelu.
  • Podgląd: gemini-2.5-flash-native-audio-preview-12-2025
Ostatnia aktualizacja Wrzesień 2025 r.
Granica wiedzy Styczeń 2025 r.