Gemini 3.1 Flash Live Preview è il nostro modello audio-audio a bassa latenza ottimizzato per dialoghi in tempo reale e applicazioni AI vocali con rilevamento di sfumature acustiche, precisione numerica e consapevolezza multimodale.
Documentazione
Visita la guida all'API Live per una copertura completa di funzionalità e capacità.
gemini-3.1-flash-live-preview
| Proprietà | Descrizione |
|---|---|
| Codice modello |
gemini-3.1-flash-live-preview
|
| Tipi di dati supportati |
Input Testo, immagini, audio, video Output Testo e audio |
| Limiti dei token[*] |
Limite di token di input 131.072 Limite di token di output 65.536 |
| Funzionalità |
Generazione di audio Supportato API batch Non supportato Memorizzazione nella cache Non supportato Esecuzione di codice Non supportato Ricerca file Non supportato Chiamata di funzione Supportato Grounding con Google Maps Non supportato Generazione di immagini Non supportato API Live Supportato Fondatezza della Ricerca Supportato Output strutturati Non supportato Ragionamento Supportato Contesto URL Non supportato |
| Versioni |
|
| Ultimo aggiornamento | Marzo 2026 |
| Knowledge cutoff | Gennaio 2025 |
Migrazione da Gemini 2.5 Flash Live
L'anteprima live di Gemini 3.1 Flash è ottimizzata per dialoghi in tempo reale a bassa latenza.
Quando esegui la migrazione da gemini-2.5-flash-native-audio-preview-12-2025, tieni presente
quanto segue:
- Stringa del modello: aggiorna la stringa del modello da
gemini-2.5-flash-native-audio-preview-12-2025agemini-3.1-flash-live-preview. - Configurazione del ragionamento: Gemini 3.1 utilizza
thinkingLevel(con impostazioni comeminimal,low,mediumehigh) anzichéthinkingBudget. Il valore predefinito èminimalper ottimizzare la latenza più bassa. Consulta Livelli e budget di pensiero. - Eventi server: un singolo
BidiGenerateContentServerContentevento ora può contenere più parti di contenuti contemporaneamente (ad esempio, blocchi audio e trascrizione). Aggiorna il codice per elaborare tutte le parti di ogni evento per evitare di perdere contenuti. - Contenuti del cliente:
send_client_contentè supportato solo per l'inserimento della cronologia del contesto iniziale (richiede l'impostazione diinitial_history_in_client_contentinhistory_config). Utilizzasend_realtime_inputper inviare aggiornamenti di testo durante la conversazione. Consulta Aggiornamenti incrementali dei contenuti. - Svolta: il valore predefinito è
TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOanzichéTURN_INCLUDES_ONLY_ACTIVITY. Il turno del modello ora include l'attività audio rilevata e tutti i frame video. Se la tua applicazione invia attualmente un flusso costante di frame video, ti consigliamo di aggiornarla in modo che invii i frame video solo quando è presente attività audio per evitare costi aggiuntivi. - Chiamata di funzione asincrona: non ancora supportata. La chiamata di funzione è solo sincrona. Il modello non inizierà a rispondere finché non avrai inviato la risposta dello strumento. Vedi Chiamata di funzione asincrona.
- Audio proattivo e dialogo affettivo: queste funzionalità non sono ancora supportate in Gemini 3.1 Flash Live. Rimuovi dal codice qualsiasi configurazione per queste funzionalità. Vedi Audio proattivo e Dialogo empatico.
Per un confronto dettagliato delle funzionalità, consulta la tabella Confronto modelli nella guida alle funzionalità.