L'API Interactions è ora disponibile a livello generale. Ti consigliamo di utilizzare questa API per accedere a tutti i modelli e a tutte le funzionalità più recenti.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Anteprima live di Gemini 3.1 Flash

L'anteprima di Gemini 3.1 Flash Live è il nostro modello audio-audio a bassa latenza ottimizzato per dialoghi in tempo reale e applicazioni AI vocali con rilevamento di sfumature acustiche, precisione numerica e consapevolezza multimodale.

Prova in Google AI Studio

Documentazione

Visita la guida all'API Live per una copertura completa di funzionalità e capacità.

gemini-3.1-flash-live-preview

Proprietà	Descrizione
Codice modello	`gemini-3.1-flash-live-preview`
Tipi di dati supportati	Input Testo, immagini, audio, video Output Testo e audio
Limiti dei token^[*]	Limite di token di input 131.072 Limite di token di output 65.536
Funzionalità	Generazione di audio Supportato Memorizzazione nella cache Non supportato Esecuzione di codice Non supportato Ricerca file Non supportato Chiamata di funzione Supportato Grounding con Google Maps Non supportato Generazione di immagini Non supportato API Live Supportato Fondatezza della Ricerca Supportato Output strutturati Non supportato Pensiero Supportato Contesto URL Non supportato
Opzioni di consumo	API batch Non supportato
Versioni	Leggi i pattern delle versioni del modello per ulteriori dettagli. Anteprima: `gemini-3.1-flash-live-preview`
Ultimo aggiornamento	Marzo 2026
Knowledge cutoff	Gennaio 2025

Migrazione da Gemini 2.5 Flash Live

L'anteprima di Gemini 3.1 Flash Live è ottimizzata per un dialogo in tempo reale a bassa latenza. Quando esegui la migrazione da gemini-2.5-flash-native-audio-preview-12-2025, tieni presente quanto segue:

Stringa del modello: aggiorna la stringa del modello da gemini-2.5-flash-native-audio-preview-12-2025 a gemini-3.1-flash-live-preview.
Configurazione del pensiero: Gemini 3.1 utilizza thinkingLevel (con impostazioni come minimal, low, medium e high) anziché thinkingBudget. Il valore predefinito è minimal per l'ottimizzazione per la latenza più bassa. Vedi Livelli e budget di pensiero.
Eventi server: un singolo BidiGenerateContentServerContent evento ora può contenere più parti di contenuti contemporaneamente (ad esempio, blocchi audio e trascrizione). Aggiorna il codice per elaborare tutte le parti di ogni evento per evitare di perdere contenuti.
Contenuti del cliente: send_client_content è supportato solo per l'inserimento della cronologia del contesto iniziale (richiede l'impostazione di initial_history_in_client_content in history_config). Utilizza send_realtime_input per inviare aggiornamenti di testo durante la conversazione. Consulta Aggiornamenti incrementali dei contenuti.
Svolta: il valore predefinito è TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO anziché TURN_INCLUDES_ONLY_ACTIVITY. Il turno del modello ora include l'attività audio rilevata e tutti i fotogrammi video. Se la tua applicazione invia attualmente un flusso costante di frame video, ti consigliamo di aggiornarla in modo che invii i frame video solo quando è presente attività audio per evitare costi aggiuntivi.
Chiamata di funzione asincrona: non ancora supportata. La chiamata di funzione è solo sincrona. Il modello non inizierà a rispondere finché non avrai inviato la risposta dello strumento. Vedi Chiamata di funzione asincrona.
Audio proattivo e dialogo affettivo: queste funzionalità non sono ancora supportate in Gemini 3.1 Flash Live. Rimuovi dal codice qualsiasi configurazione per queste funzionalità. Vedi Audio proattivo e Dialogo empatico.

Per un confronto dettagliato delle funzionalità, consulta la tabella Confronto modelli nella guida alle funzionalità.