Modelos


Gemini 3


Gemini 2.5 Flash

Gemini 2.5 Flash

Nosso melhor modelo de preço-desempenho para tarefas de baixa latência e alto volume que exigem raciocínio.

Nano Banana

Geração e edição de imagens nativas de última geração projetadas para fluxos de trabalho rápidos e criativos.

Visualização do Gemini 2.5 Flash Live

Otimizado para agentes conversacionais em tempo real com streaming de áudio nativo de menos de um segundo.

Visualização do Gemini 2.5 Flash TTS

Geração de áudio de conversão de texto em voz controlável com controle preciso sobre estilo e ritmo.


Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite

O modelo multimodal mais rápido e econômico da família 2.5.


Gemini 2.5 Pro

Gemini 2.5 Pro

Nosso modelo mais avançado para tarefas complexas, com recursos de raciocínio profundo e programação.

Visualização do Gemini 2.5 Pro TTS

Síntese de fala de alta fidelidade otimizada para qualidade em fluxos de trabalho estruturados, como podcasts e audiolivros.


Modelos de áudio

Esta seção contém todos os modelos de áudio, incluindo aqueles que já podem estar listados em outras seções

Visualização do Gemini 3.1 Flash Live Preview

Nosso modelo de áudio para áudio (A2A) de alta qualidade e baixa latência projetado para diálogo em tempo real e aplicativos de IA com voz.

Visualização do Gemini 3.1 Flash TTS

Geração de fala poderosa e de baixa latência, com saídas naturais, comandos direcionáveis e novas tags de áudio expressivas para controle preciso da narração.

Visualização do Gemini 2.5 Flash Live

Nosso modelo de API Live principal para agentes de voz e vídeo bidirecionais de baixa latência com raciocínio de áudio nativo.

Visualização do Gemini 2.5 Flash TTS

Conversão de texto em voz rápida e controlável para aplicativos de baixa latência e econômicos e assistentes em tempo real.

Visualização do Gemini 2.5 Pro TTS

Síntese de fala de alta fidelidade otimizada para qualidade em fluxos de trabalho estruturados, como podcasts e audiolivros.


Modelos de mídia generativa

Esta seção contém todos os modelos de mídia generativa, incluindo aqueles que já podem estar listados em outras seções

Visualização do Nano Banana 2

Criação visual de alta eficiência e escala de produção, combinando a inteligência da série Gemini 3 com velocidades de geração extremamente rápidas.

Visualização do Veo 3.1

Geração de vídeo cinematográfico de última geração com controles criativos avançados e áudio sincronizado nativamente.

Visualização do Nano Banana Pro

Um mecanismo de design profissional com um núcleo de raciocínio para recursos visuais 4K com qualidade de estúdio, layouts complexos e renderização de texto precisa.

Visualização do Veo 3.1 Lite

Geração, edição e controle cinematográfico de vídeo de alta eficiência, baixo custo e prioridade para desenvolvedores da família Veo 3.1.

Nano Banana

Geração e edição de imagens nativas de última geração projetadas para fluxos de trabalho rápidos e criativos.

Imagen 4

Modelo de conversão de texto em imagem, com geração rápida e ultrarrápida e clareza excepcional de até 2K de resolução.


Modelos de geração de música

Esta seção contém todos os modelos de geração de música, incluindo aqueles que já podem estar listados em outras seções

Visualização do Lyria 3 Pro

Nosso modelo principal de geração de música, otimizado para músicas completas com coerência estrutural complexa.

Visualização do Lyria 3 Clip

Otimizado para gerar clipes musicais curtos, loops e visualizações de até 30 segundos.

Lyria RealTime Experimental

Modelo de geração de música de alta fidelidade que oferece controle criativo granular e recursos de streaming em tempo real.


Modelos de ferramentas e agentes

Visualização de uso do computador

Um modelo especializado que pode "ver" uma tela digital e realizar ações de interface, como clicar, digitar e navegar, para automatizar tarefas complexas do navegador.

Visualização do Gemini Deep Research

Um modelo de agente que planeja e executa de forma autônoma pesquisas de várias etapas em centenas de fontes para produzir relatórios citados e interativos.

Visualização do Gemini Deep Research Max

Máxima abrangência para coleta e síntese de contexto automatizadas em centenas de fontes.


Modelos de tarefas especializadas

Gemini Embedding 2

Nosso primeiro modelo de embedding multimodal, que mapeia texto, imagens, vídeo, áudio e PDFs em um espaço de embedding unificado para pesquisa semântica avançada e sistemas RAG.

Gemini Embedding

Representações vetoriais de alta dimensão para pesquisa semântica avançada, classificação de texto e sistemas RAG.

Visualização do Gemini Robotics-ER 1.6

Modelo avançado de raciocínio incorporado que entende espaços físicos e planeja tarefas de várias etapas para agentes robóticos com novas capacidades, como leitura de instrumentos, raciocínio espacial e físico aprimorado.

Visualização do Gemini Robotics-ER 1.5

Modelo avançado de raciocínio incorporado que entende espaços físicos e planeja tarefas de várias etapas para agentes robóticos.


Modelos anteriores

Gemini 2.0 Flash descontinuado

Nosso modelo de segunda geração, com recursos de última geração e capacidades aprimoradas, incluindo velocidade superior, uso de ferramentas nativas e uma janela de contexto de 1 milhão de tokens.

Gemini 2.0 Flash-Lite descontinuado

Nosso modelo de segunda geração mais rápido, otimizado para eficiência de custo e baixa latência.

Visualização do Gemini 3 Pro desativada

Nosso modelo de raciocínio de última geração, com compreensão multimodal avançada.


Padrões de nome da versão do modelo

Os modelos do Gemini estão disponíveis nas versões estável, visualização, mais recente ou experimental.

Estável

Aponta para um modelo estável específico. Os modelos estáveis geralmente não mudam. A maioria dos apps de produção precisa usar um modelo estável específico.

Por exemplo: gemini-2.5-flash.

Visualização

Aponta para um modelo de visualização que pode ser usado para produção. Os modelos de visualização normalmente têm o faturamento ativado, podem vir com limites de taxa mais restritivos e serão descontinuados com pelo menos duas semanas de antecedência.

Por exemplo: gemini-2.5-flash-preview-09-2025.

Mais recentes

Aponta para a versão mais recente de uma variação de modelo específica. Essa pode ser uma versão estável, de visualização ou experimental. Esse alias será trocado a quente com cada novo lançamento de uma variação de modelo específica. Um aviso de duas semanas será enviado por e-mail antes que a versão mais recente seja alterada.

Por exemplo: gemini-flash-latest.

Experimental

Aponta para um modelo experimental que normalmente não é adequado para uso em produção e vem com limites de taxa mais restritivos. Lançamos modelos experimentais para coletar feedback e disponibilizar nossas atualizações mais recentes aos desenvolvedores rapidamente.

Os modelos experimentais não são estáveis, e a disponibilidade dos endpoints do modelo está sujeita a mudanças.

Descontinuações de modelos

Para informações sobre descontinuações de modelos, acesse a página de descontinuações do Gemini.