L'anteprima live di Gemini 3.1 Flash è il nostro modello audio-audio a bassa latenza ottimizzato per dialoghi in tempo reale e applicazioni di AI vocali con rilevamento delle sfumature acustiche, precisione numerica e consapevolezza multimodale.
Documentazione
Visita la guida dell'API Live per una copertura completa di funzionalità e capacità.
gemini-3.1-flash-live-preview
| Proprietà | Descrizione |
|---|---|
| Codice modello |
gemini-3.1-flash-live-preview
|
| Tipi di dati supportati |
Input Testo, immagini, audio, video Output Testo e audio |
| Limiti di token[*] |
Limite di token di input 131.072 Limite di token di output 65.536 |
| Funzionalità |
Generazione audio Supportato API batch Non supportato Memorizzazione nella cache Non supportato Esecuzione del codice Non supportato Ricerca di file Non supportato Chiamata di funzione Supportato Fondatezza con Google Maps Non supportato Generazione di immagini Non supportato API Live Supportato Fondatezza della Ricerca Supportato Output strutturati Non supportato Ragionamento Supportato Contesto URL Non supportato |
| Versioni |
|
| Ultimo aggiornamento | Marzo 2026 |
| knowledge cutoff | Gennaio 2025 |
Migrazione da Gemini 2.5 Flash Live
L'anteprima live di Gemini 3.1 Flash è ottimizzata per dialoghi in tempo reale a bassa latenza.
Quando esegui la migrazione da gemini-2.5-flash-native-audio-preview-12-2025, tieni presente quanto segue:
- Stringa del modello: aggiorna la stringa del modello da
gemini-2.5-flash-native-audio-preview-12-2025agemini-3.1-flash-live-preview. - Configurazione del ragionamento: Gemini 3.1 utilizza
thinkingLevel(con impostazioni comeminimal,low,medium, ehigh) anzichéthinkingBudget. Il valore predefinito èminimalper ottimizzare la latenza più bassa. Consulta Livelli e budget di pensiero. - Eventi server: un singolo
BidiGenerateContentServerContentevento ora può contenere più parti di contenuti contemporaneamente (ad esempio, blocchi audio e trascrizione). Aggiorna il codice per elaborare tutte le parti in ogni evento per evitare di perdere contenuti. - Contenuti client:
send_client_contentè supportato solo per l'inserimento della cronologia del contesto iniziale (richiede l'impostazione diinitial_history_in_client_contentinhistory_config). Utilizzasend_realtime_inputper inviare aggiornamenti di testo durante la conversazione. Consulta Aggiornamenti incrementali dei contenuti. - Copertura dei turni: il valore predefinito è
TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOanzichéTURN_INCLUDES_ONLY_ACTIVITY. Il turno del modello ora include l'attività audio rilevata e tutti i frame video. Se la tua applicazione invia attualmente un flusso costante di frame video, potresti volerla aggiornare in modo da inviare i frame video solo quando è presente un'attività audio per evitare costi aggiuntivi. - Chiamata di funzione asincrona: non ancora supportata. La chiamata di funzione è solo sincrona. Il modello non inizierà a rispondere finché non avrai inviato la risposta dello strumento. Consulta Chiamata di funzione asincrona.
- Audio proattivo e dialogo affettivo: queste funzionalità non sono ancora supportate in Gemini 3.1 Flash Live. Rimuovi qualsiasi configurazione per queste funzionalità dal codice. Consulta Audio proattivo e Dialogo affettivo.
Per un confronto dettagliato delle funzionalità, consulta la tabella di confronto dei modelli nella guida alle funzionalità.