L'anteprima di Gemini 3.1 Flash Live è il nostro modello audio-audio a bassa latenza ottimizzato per dialoghi in tempo reale e applicazioni AI vocali con rilevamento di sfumature acustiche, precisione numerica e consapevolezza multimodale.
Documentazione
Visita la guida all'API Live per una copertura completa di funzionalità e capacità.
gemini-3.1-flash-live-preview
| Proprietà | Descrizione |
|---|---|
| Codice modello |
gemini-3.1-flash-live-preview
|
| Tipi di dati supportati |
Input Testo, immagini, audio, video Output Testo e audio |
| Limiti dei token[*] |
Limite di token di input 131.072 Limite di token di output 65.536 |
| Funzionalità |
Supportato Non supportato Non supportato Non supportato Supportato Non supportato Non supportato Supportato Supportato Non supportato Supportato Non supportato |
| Opzioni di consumo |
Non supportato |
| Versioni |
|
| Ultimo aggiornamento | Marzo 2026 |
| Knowledge cutoff | Gennaio 2025 |
Migrazione da Gemini 2.5 Flash Live
L'anteprima di Gemini 3.1 Flash Live è ottimizzata per un dialogo in tempo reale a bassa latenza.
Quando esegui la migrazione da gemini-2.5-flash-native-audio-preview-12-2025, tieni presente
quanto segue:
- Stringa del modello: aggiorna la stringa del modello da
gemini-2.5-flash-native-audio-preview-12-2025agemini-3.1-flash-live-preview. - Configurazione del pensiero: Gemini 3.1 utilizza
thinkingLevel(con impostazioni comeminimal,low,mediumehigh) anzichéthinkingBudget. Il valore predefinito èminimalper l'ottimizzazione per la latenza più bassa. Vedi Livelli e budget di pensiero. - Eventi server: un singolo
BidiGenerateContentServerContentevento ora può contenere più parti di contenuti contemporaneamente (ad esempio, blocchi audio e trascrizione). Aggiorna il codice per elaborare tutte le parti di ogni evento per evitare di perdere contenuti. - Contenuti del cliente:
send_client_contentè supportato solo per l'inserimento della cronologia del contesto iniziale (richiede l'impostazione diinitial_history_in_client_contentinhistory_config). Utilizzasend_realtime_inputper inviare aggiornamenti di testo durante la conversazione. Consulta Aggiornamenti incrementali dei contenuti. - Svolta: il valore predefinito è
TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOanzichéTURN_INCLUDES_ONLY_ACTIVITY. Il turno del modello ora include l'attività audio rilevata e tutti i fotogrammi video. Se la tua applicazione invia attualmente un flusso costante di frame video, ti consigliamo di aggiornarla in modo che invii i frame video solo quando è presente attività audio per evitare costi aggiuntivi. - Chiamata di funzione asincrona: non ancora supportata. La chiamata di funzione è solo sincrona. Il modello non inizierà a rispondere finché non avrai inviato la risposta dello strumento. Vedi Chiamata di funzione asincrona.
- Audio proattivo e dialogo affettivo: queste funzionalità non sono ancora supportate in Gemini 3.1 Flash Live. Rimuovi dal codice qualsiasi configurazione per queste funzionalità. Vedi Audio proattivo e Dialogo empatico.
Per un confronto dettagliato delle funzionalità, consulta la tabella Confronto modelli nella guida alle funzionalità.