Podgląd na żywo Gemini 2.5 Flash

Interfejs Live API umożliwia interakcje z użyciem głosu i wideo w czasie rzeczywistym z niewielkimi opóźnieniami dzięki Gemini 2.5 Flash. Przetwarza ciągłe strumienie audio, wideo lub tekstu, aby dostarczać natychmiastowe odpowiedzi głosowe, które brzmią jak ludzkie, tworząc naturalne doświadczenie konwersacyjne dla użytkowników.

Dokumentacja

Więcej informacji o funkcjach i możliwościach znajdziesz w przewodniku po interfejsie Live API.

gemini-2.5-flash-native-audio-preview-12-2025

Właściwość Opis
Kod modelu gemini-2.5-flash-native-audio-preview-12-2025
Obsługiwane typy danych

Dane wejściowe

Audio, wideo, tekst

Dane wyjściowe

Dźwięk i tekst

Limity tokenów[*]

Limit tokenów wejściowych

131 072

Limit tokenów wyjściowych

8192

Uprawnienia

Generowanie dźwięku

Obsługiwane

Batch API

Nieobsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Wyszukiwanie plików

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Grounding z użyciem Map Google

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Live API

Obsługiwane

Szukaj groundingu

Obsługiwane

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Myślenie

Obsługiwane

Kontekst adresu URL

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w wzorcach wersji modelu.
  • Podgląd: gemini-2.5-flash-native-audio-preview-12-2025
  • Podgląd: gemini-2.5-flash-native-audio-preview-09-2025
Ostatnia aktualizacja Wrzesień 2025 r.
Granica wiedzy Styczeń 2025 r.