Gemini 3
Gemini 3.1 Pro
Inteligência avançada, habilidades complexas de resolução de problemas e recursos poderosos de codificação de agentes e vibração.
Visualizar
Gemini 3 Flash
Desempenho de classe de fronteira que rivaliza com modelos maiores a uma fração do custo.
Visualizar
Gemini 3.1 Flash-Lite
Desempenho de classe de fronteira que rivaliza com modelos maiores a uma fração do custo.
Visualizar
Nano Banana 2
Geração e edição de imagens eficientes e poderosas, otimizadas para velocidade e casos de uso de alto volume.
Visualizar
Nano Banana Pro
Modelos de geração e edição de imagens de última geração para criação de imagens nativas altamente contextuais.
Visualizar
Gemini 3.1 Flash Live
Modelo de API Live de alta qualidade e baixa latência para diálogo em tempo real e aplicativos de IA com voz.
Nova visualização
Gemini 3.1 Flash TTS
Geração de fala poderosa e de baixa latência.
Nova visualização
Gemini 2.5 Flash
Gemini 2.5 Flash
Nosso melhor modelo de preço-desempenho para tarefas de baixa latência e alto volume que exigem raciocínio.
Nano Banana
Geração e edição de imagens nativas de última geração projetadas para fluxos de trabalho rápidos e criativos.
Visualização do Gemini 2.5 Flash Live
Otimizado para agentes conversacionais em tempo real com streaming de áudio nativo de menos de um segundo.
Visualização do Gemini 2.5 Flash TTS
Geração de áudio de conversão de texto em voz controlável com controle preciso sobre estilo e ritmo.
Gemini 2.5 Flash-Lite
Gemini 2.5 Flash-Lite
O modelo multimodal mais rápido e econômico da família 2.5.
Gemini 2.5 Pro
Gemini 2.5 Pro
Nosso modelo mais avançado para tarefas complexas, com recursos de raciocínio profundo e programação.
Visualização do Gemini 2.5 Pro TTS
Síntese de fala de alta fidelidade otimizada para qualidade em fluxos de trabalho estruturados, como podcasts e audiolivros.
Modelos de áudio
Esta seção contém todos os modelos de áudio, incluindo aqueles que já podem estar listados em outras seções
Visualização do Gemini 3.1 Flash Live Preview
Nosso modelo de áudio para áudio (A2A) de alta qualidade e baixa latência projetado para diálogo em tempo real e aplicativos de IA com voz.
Visualização do Gemini 3.1 Flash TTS
Geração de fala poderosa e de baixa latência, com saídas naturais, comandos direcionáveis e novas tags de áudio expressivas para controle preciso da narração.
Visualização do Gemini 2.5 Flash Live
Nosso modelo de API Live principal para agentes de voz e vídeo bidirecionais de baixa latência com raciocínio de áudio nativo.
Visualização do Gemini 2.5 Flash TTS
Conversão de texto em voz rápida e controlável para aplicativos de baixa latência e econômicos e assistentes em tempo real.
Visualização do Gemini 2.5 Pro TTS
Síntese de fala de alta fidelidade otimizada para qualidade em fluxos de trabalho estruturados, como podcasts e audiolivros.
Modelos de mídia generativa
Esta seção contém todos os modelos de mídia generativa, incluindo aqueles que já podem estar listados em outras seções
Visualização do Nano Banana 2
Criação visual de alta eficiência e escala de produção, combinando a inteligência da série Gemini 3 com velocidades de geração extremamente rápidas.
Visualização do Veo 3.1
Geração de vídeo cinematográfico de última geração com controles criativos avançados e áudio sincronizado nativamente.
Visualização do Nano Banana Pro
Um mecanismo de design profissional com um núcleo de raciocínio para recursos visuais 4K com qualidade de estúdio, layouts complexos e renderização de texto precisa.
Visualização do Veo 3.1 Lite
Geração, edição e controle cinematográfico de vídeo de alta eficiência, baixo custo e prioridade para desenvolvedores da família Veo 3.1.
Nano Banana
Geração e edição de imagens nativas de última geração projetadas para fluxos de trabalho rápidos e criativos.
Imagen 4
Modelo de conversão de texto em imagem, com geração rápida e ultrarrápida e clareza excepcional de até 2K de resolução.
Modelos de geração de música
Esta seção contém todos os modelos de geração de música, incluindo aqueles que já podem estar listados em outras seções
Visualização do Lyria 3 Pro
Nosso modelo principal de geração de música, otimizado para músicas completas com coerência estrutural complexa.
Visualização do Lyria 3 Clip
Otimizado para gerar clipes musicais curtos, loops e visualizações de até 30 segundos.
Lyria RealTime Experimental
Modelo de geração de música de alta fidelidade que oferece controle criativo granular e recursos de streaming em tempo real.
Modelos de ferramentas e agentes
Visualização de uso do computador
Um modelo especializado que pode "ver" uma tela digital e realizar ações de interface, como clicar, digitar e navegar, para automatizar tarefas complexas do navegador.
Visualização do Gemini Deep Research
Um modelo de agente que planeja e executa de forma autônoma pesquisas de várias etapas em centenas de fontes para produzir relatórios citados e interativos.
Visualização do Gemini Deep Research Max
Máxima abrangência para coleta e síntese de contexto automatizadas em centenas de fontes.
Modelos de tarefas especializadas
Gemini Embedding 2
Nosso primeiro modelo de embedding multimodal, que mapeia texto, imagens, vídeo, áudio e PDFs em um espaço de embedding unificado para pesquisa semântica avançada e sistemas RAG.
Gemini Embedding
Representações vetoriais de alta dimensão para pesquisa semântica avançada, classificação de texto e sistemas RAG.
Visualização do Gemini Robotics-ER 1.6
Modelo avançado de raciocínio incorporado que entende espaços físicos e planeja tarefas de várias etapas para agentes robóticos com novas capacidades, como leitura de instrumentos, raciocínio espacial e físico aprimorado.
Visualização do Gemini Robotics-ER 1.5
Modelo avançado de raciocínio incorporado que entende espaços físicos e planeja tarefas de várias etapas para agentes robóticos.
Modelos anteriores
Gemini 2.0 Flash descontinuado
Nosso modelo de segunda geração, com recursos de última geração e capacidades aprimoradas, incluindo velocidade superior, uso de ferramentas nativas e uma janela de contexto de 1 milhão de tokens.
Gemini 2.0 Flash-Lite descontinuado
Nosso modelo de segunda geração mais rápido, otimizado para eficiência de custo e baixa latência.
Visualização do Gemini 3 Pro desativada
Nosso modelo de raciocínio de última geração, com compreensão multimodal avançada.
Padrões de nome da versão do modelo
Os modelos do Gemini estão disponíveis nas versões estável, visualização, mais recente ou experimental.
Estável
Aponta para um modelo estável específico. Os modelos estáveis geralmente não mudam. A maioria dos apps de produção precisa usar um modelo estável específico.
Por exemplo: gemini-2.5-flash.
Visualização
Aponta para um modelo de visualização que pode ser usado para produção. Os modelos de visualização normalmente têm o faturamento ativado, podem vir com limites de taxa mais restritivos e serão descontinuados com pelo menos duas semanas de antecedência.
Por exemplo: gemini-2.5-flash-preview-09-2025.
Mais recentes
Aponta para a versão mais recente de uma variação de modelo específica. Essa pode ser uma versão estável, de visualização ou experimental. Esse alias será trocado a quente com cada novo lançamento de uma variação de modelo específica. Um aviso de duas semanas será enviado por e-mail antes que a versão mais recente seja alterada.
Por exemplo: gemini-flash-latest.
Experimental
Aponta para um modelo experimental que normalmente não é adequado para uso em produção e vem com limites de taxa mais restritivos. Lançamos modelos experimentais para coletar feedback e disponibilizar nossas atualizações mais recentes aos desenvolvedores rapidamente.
Os modelos experimentais não são estáveis, e a disponibilidade dos endpoints do modelo está sujeita a mudanças.
Descontinuações de modelos
Para informações sobre descontinuações de modelos, acesse a página de descontinuações do Gemini.