Anteprima live di Gemini 3.1 Flash

L'anteprima live di Gemini 3.1 Flash è il nostro modello audio-audio a bassa latenza ottimizzato per dialoghi in tempo reale e applicazioni di AI vocali con rilevamento delle sfumature acustiche, precisione numerica e consapevolezza multimodale.

Documentazione

Visita la guida dell'API Live per una copertura completa di funzionalità e capacità.

gemini-3.1-flash-live-preview

Proprietà Descrizione
Codice modello gemini-3.1-flash-live-preview
Tipi di dati supportati

Input

Testo, immagini, audio, video

Output

Testo e audio

Limiti di token[*]

Limite di token di input

131.072

Limite di token di output

65.536

Funzionalità

Generazione audio

Supportato

API batch

Non supportato

Memorizzazione nella cache

Non supportato

Esecuzione del codice

Non supportato

Ricerca di file

Non supportato

Chiamata di funzione

Supportato

Fondatezza con Google Maps

Non supportato

Generazione di immagini

Non supportato

API Live

Supportato

Fondatezza della Ricerca

Supportato

Output strutturati

Non supportato

Ragionamento

Supportato

Contesto URL

Non supportato

Versioni
Per maggiori dettagli, leggi i pattern delle versioni del modello.
  • Anteprima: gemini-3.1-flash-live-preview
Ultimo aggiornamento Marzo 2026
knowledge cutoff Gennaio 2025

Migrazione da Gemini 2.5 Flash Live

L'anteprima live di Gemini 3.1 Flash è ottimizzata per dialoghi in tempo reale a bassa latenza. Quando esegui la migrazione da gemini-2.5-flash-native-audio-preview-12-2025, tieni presente quanto segue:

  • Stringa del modello: aggiorna la stringa del modello da gemini-2.5-flash-native-audio-preview-12-2025 a gemini-3.1-flash-live-preview.
  • Configurazione del ragionamento: Gemini 3.1 utilizza thinkingLevel (con impostazioni come minimal, low, medium, e high) anziché thinkingBudget. Il valore predefinito è minimal per ottimizzare la latenza più bassa. Consulta Livelli e budget di pensiero.
  • Eventi server: un singolo BidiGenerateContentServerContent evento ora può contenere più parti di contenuti contemporaneamente (ad esempio, blocchi audio e trascrizione). Aggiorna il codice per elaborare tutte le parti in ogni evento per evitare di perdere contenuti.
  • Contenuti client: send_client_content è supportato solo per l'inserimento della cronologia del contesto iniziale (richiede l'impostazione di initial_history_in_client_content in history_config). Utilizza send_realtime_input per inviare aggiornamenti di testo durante la conversazione. Consulta Aggiornamenti incrementali dei contenuti.
  • Copertura dei turni: il valore predefinito è TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO anziché TURN_INCLUDES_ONLY_ACTIVITY. Il turno del modello ora include l'attività audio rilevata e tutti i frame video. Se la tua applicazione invia attualmente un flusso costante di frame video, potresti volerla aggiornare in modo da inviare i frame video solo quando è presente un'attività audio per evitare costi aggiuntivi.
  • Chiamata di funzione asincrona: non ancora supportata. La chiamata di funzione è solo sincrona. Il modello non inizierà a rispondere finché non avrai inviato la risposta dello strumento. Consulta Chiamata di funzione asincrona.
  • Audio proattivo e dialogo affettivo: queste funzionalità non sono ancora supportate in Gemini 3.1 Flash Live. Rimuovi qualsiasi configurazione per queste funzionalità dal codice. Consulta Audio proattivo e Dialogo affettivo.

Per un confronto dettagliato delle funzionalità, consulta la tabella di confronto dei modelli nella guida alle funzionalità.