A prévia do Gemini 3.1 Flash Live é nosso modelo de áudio para áudio de baixa latência otimizado para diálogo em tempo real e aplicativos de IA com voz em primeiro lugar, com detecção de nuances acústicas, precisão numérica e reconhecimento multimodal.
Documentação
Acesse o guia da API Live para conferir a cobertura completa de recursos e funcionalidades.
gemini-3.1-flash-live-preview
| Propriedade | Descrição |
|---|---|
| Código do modelo |
gemini-3.1-flash-live-preview
|
| Tipos de dados compatíveis |
Entradas (link em inglês) Texto, imagens, áudio, vídeo Saída Texto e áudio |
| Limites de token[*] |
Limite de token de entrada 131.072 Limite de token de saída 65.536 |
| Recursos |
Geração de áudio Compatível API em lote indisponível Armazenamento em cache indisponível Execução de código indisponível Pesquisa de arquivos incompatível Chamada de função Compatível Embasamento com o Google Maps indisponível Geração de imagens indisponível API Live Compatível Embasamento da pesquisa Compatível Respostas estruturadas indisponível Raciocínio Compatível Contexto de URL indisponível |
| Versões |
|
| Última atualização | Março de 2026 |
| Limite de conhecimento | Janeiro de 2025 |
Migração do Gemini 2.5 Flash Live
A prévia do Gemini 3.1 Flash Live é otimizada para diálogo em tempo real de baixa latência.
Ao migrar do gemini-2.5-flash-native-audio-preview-12-2025, considere o seguinte:
- String do modelo: atualize a string do modelo de
gemini-2.5-flash-native-audio-preview-12-2025paragemini-3.1-flash-live-preview. - Configuração de raciocínio: o Gemini 3.1 usa
thinkingLevel(com configurações comominimal,low,medium, ehigh) em vez dethinkingBudget. O padrão éminimalpara otimizar a menor latência. Consulte Níveis e orçamentos de pensamento. - Eventos do servidor: um único
BidiGenerateContentServerContentevento agora pode conter várias partes de conteúdo simultaneamente (por exemplo, blocos de áudio e transcrição). Atualize seu código para processar todas as partes em cada evento para evitar a perda de conteúdo. - Conteúdo do cliente:
send_client_contentsó é compatível com a propagação do histórico de contexto inicial (requer a configuração deinitial_history_in_client_contentemhistory_config). Usesend_realtime_inputpara enviar atualizações de texto durante a conversa. Consulte Atualizações incrementais de conteúdo. - Cobertura de turnos: o padrão é
TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOem vez deTURN_INCLUDES_ONLY_ACTIVITY. O turno do modelo agora inclui a atividade de áudio detectada e todos os frames de vídeo. Se o aplicativo enviar um fluxo constante de frames de vídeo, atualize-o para enviar frames de vídeo apenas quando houver atividade de áudio para evitar custos adicionais. - Chamada de função assíncrona: ainda não é compatível. A chamada de função é apenas síncrona. O modelo não vai começar a responder até que você envie a resposta da ferramenta. Consulte Chamada de função assíncrona.
- Áudio proativo e diálogo afetivo: esses recursos ainda não são compatíveis com o Gemini 3.1 Flash Live. Remova qualquer configuração desses recursos do seu código. Consulte Áudio proativo e Diálogo afetivo.
Para uma comparação detalhada de recursos, consulte a tabela de comparação de modelos no guia de recursos.