O Gemini 3.1 Flash Live Preview é nosso modelo de áudio para áudio de baixa latência otimizado para diálogo em tempo real e aplicativos de IA com voz em primeiro lugar, com detecção de nuances acústicas, precisão numérica e reconhecimento multimodal.
Documentação
Acesse o guia da API Live para conferir a cobertura completa de recursos e funcionalidades.
gemini-3.1-flash-live-preview
| Propriedade | Descrição |
|---|---|
| Código do modelo |
gemini-3.1-flash-live-preview
|
| Tipos de dados com suporte |
Entradas Texto, imagens, áudio, vídeo Saída Texto e áudio |
| Limites de token[*] |
Limite de token de entrada 131.072 Limite de token de saída 65.536 |
| Recursos |
Compatível Indisponível Indisponível Incompatível Compatível Indisponível Indisponível Compatível Compatível Indisponível Compatível Indisponível |
| Opções de consumo |
Indisponível |
| Versões |
|
| Atualização mais recente | Março de 2026 |
| Limite de conhecimento | Janeiro de 2025 |
Migração do Gemini 2.5 Flash Live
O Gemini 3.1 Flash Live Preview é otimizado para diálogo em tempo real de baixa latência.
Ao migrar do gemini-2.5-flash-native-audio-preview-12-2025, considere o seguinte:
- String do modelo: atualize a string do modelo de
gemini-2.5-flash-native-audio-preview-12-2025paragemini-3.1-flash-live-preview. - Configuração de raciocínio: o Gemini 3.1 usa
thinkingLevel(com configurações comominimal,low,medium, ehigh) em vez dethinkingBudget. O padrão éminimalpara otimizar a latência mais baixa. Consulte Níveis e orçamentos de raciocínio. - Eventos do servidor: um único
BidiGenerateContentServerContentevento agora pode conter várias partes de conteúdo simultaneamente (por exemplo, blocos de áudio e transcrição). Atualize seu código para processar todas as partes em cada evento para evitar a perda de conteúdo. - Conteúdo do cliente:
send_client_contentsó é compatível com o histórico de contexto inicial (requer a configuração deinitial_history_in_client_contentemhistory_config). Usesend_realtime_inputpara enviar atualizações de texto durante a conversa. Consulte Atualizações incrementais de conteúdo. - Cobertura de turnos: o padrão é
TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOem vez deTURN_INCLUDES_ONLY_ACTIVITY. O turno do modelo agora inclui a atividade de áudio detectada e todos os frames de vídeo. Se o aplicativo enviar um fluxo constante de frames de vídeo, atualize-o para enviar frames de vídeo apenas quando houver atividade de áudio para evitar custos adicionais. - Chamada de função assíncrona: ainda não é compatível. A chamada de função é apenas síncrona. O modelo não vai começar a responder até que você envie a resposta da ferramenta. Consulte Chamada de função assíncrona.
- Áudio proativo e diálogo afetivo: esses recursos ainda não são compatíveis com o Gemini 3.1 Flash Live. Remova qualquer configuração desses recursos do seu código. Consulte Áudio proativo e Diálogo afetivo.
Para uma comparação detalhada de recursos, consulte a tabela de comparação de modelos no guia de recursos.