Pamje paraprake e drejtpërdrejtë e Gemini 3.1 Flash

Gemini 3.1 Flash Live Preview është modeli ynë me vonesë të ulët, audio-në-audio, i optimizuar për dialog në kohë reale dhe aplikacione të inteligjencës artificiale me zë të parë, me zbulim të nuancave akustike, saktësi numerike dhe ndërgjegjësim multimodal.

Dokumentacioni

Vizitoni udhëzuesin Live API për një mbulim të plotë të veçorive dhe aftësive.

Gemini-3.1-flash-live-pamje paraprake

Pronë Përshkrimi
Kodi i modelit të gemini-3.1-flash-live-preview
llojet e të dhënave të mbështetura

Të dhënat hyrëse

Tekst, imazhe, audio, video

Prodhimi

Tekst dhe audio

Limitet token-it [*]

Limiti i tokenit të hyrjes

131,072

Limiti i tokenit të daljes

65,536

Aftësitë e

Gjenerimi i audios

Mbështetur

API-ja e grupeve

Nuk mbështetet

Ruajtja në memorje

Nuk mbështetet

Ekzekutimi i kodit

Nuk mbështetet

Kërkim skedarësh

Nuk mbështetet

Thirrja e funksionit

Mbështetur

Tokëzimi me Google Maps

Nuk mbështetet

Gjenerimi i imazhit

Nuk mbështetet

API i drejtpërdrejtë

Mbështetur

Kërkimi në tokë

Mbështetur

Rezultatet e strukturuara

Nuk mbështetet

Të menduarit

Mbështetur

Konteksti i URL-së

Nuk mbështetet

Versione
Lexoni modelet e versionit të modelit për më shumë detaje.
  • Parapamje: gemini-3.1-flash-live-preview
Përditësimi më i fundit Mars 2026
i njohurive Janar 2025

Migrimi nga Gemini 2.5 Flash Live

Gemini 3.1 Flash Live Preview është optimizuar për dialog me vonesë të ulët dhe në kohë reale. Kur migroni nga gemini-2.5-flash-native-audio-preview-12-2025 , merrni parasysh sa vijon:

  • Vargu i modelit : Përditësoni vargun e modelit tuaj nga gemini-2.5-flash-native-audio-preview-12-2025gemini-3.1-flash-live-preview .
  • Konfigurimi i të menduarit : Gemini 3.1 përdor thinkingLevel (me cilësime si minimal , low , medium dhe high ) në vend të thinkingBudget . Vlera parazgjedhur është minimal për të optimizuar për vonesën më të ulët. Shihni Nivelet dhe buxhetet e të menduarit .
  • Ngjarjet e serverit : Një ngjarje e vetme BidiGenerateContentServerContent tani mund të përmbajë pjesë të shumta përmbajtjeje njëkohësisht (për shembull, pjesë audio dhe transkript). Përditësoni kodin tuaj për të përpunuar të gjitha pjesët në secilën ngjarje për të shmangur humbjen e përmbajtjes.
  • Përmbajtja e klientit : send_client_content mbështetet vetëm për mbjelljen e historikut të kontekstit fillestar (kërkon vendosjen e initial_history_in_client_contenthistory_config ). Përdorni send_realtime_input për të dërguar përditësime me tekst gjatë bisedës. Shihni Përditësimet shtesë të përmbajtjes .
  • Mbulimi i kthesës : Parazgjedhja është TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO në vend të TURN_INCLUDES_ONLY_ACTIVITY . Rradha e modelit tani përfshin aktivitetin audio të zbuluar dhe të gjitha kuadrot video. Nëse aplikacioni juaj aktualisht dërgon një rrjedhë të vazhdueshme kuadrosh video, mund të dëshironi ta përditësoni aplikacionin tuaj për të dërguar kuadrosh video vetëm kur ka aktivitet audio për të shmangur kostot shtesë.
  • Thirrja e funksionit asinkron : Nuk mbështetet ende. Thirrja e funksionit është vetëm sinkrone. Modeli nuk do të fillojë të përgjigjet derisa të keni dërguar përgjigjen e mjetit. Shih Thirrja e funksionit asinkron .
  • Audio proaktive dhe dialogu afektiv : Këto veçori nuk mbështeten ende në Gemini 3.1 Flash Live. Hiqni çdo konfigurim për këto veçori nga kodi juaj. Shihni Audio proaktive dhe dialogu afektiv .

Për një krahasim të detajuar të veçorive, shihni tabelën e krahasimit të modelit në udhëzuesin e aftësive.