A API Interactions já está disponível para todos os usuários. Recomendamos usar essa API para acessar todos os recursos e modelos mais recentes.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modelos

Este guia apresenta todos os modelos disponíveis na API Gemini.

Gemini 3

Estável

Gemini 3.5 Flash

O modelo mais inteligente para desempenho de ponta sustentado em tarefas de agentes e programação.

Estável

Gemini 3.1 Flash-Lite

Desempenho de ponta que rivaliza com modelos maiores a uma fração do custo.

Estável

Nano Banana 2

Geração e edição de imagens eficientes e avançadas, otimizadas para velocidade e casos de uso de alto volume.

Estável

Nano Banana 2 Lite

Geração e edição de imagens econômicas e de latência ultrabaixa, projetadas para casos de uso interativos de alto volume.

Estável

Nano Banana Pro

Modelos de edição e geração de imagens de última geração para criação de imagens nativas altamente contextuais.

Estável

Pré-lançamento

Gemini 3.1 Pro

Inteligência avançada, habilidades complexas de resolução de problemas e recursos avançados de programação de agentes e vibe.

Pré-lançamento

Gemini 3 Flash

Desempenho de ponta que rivaliza com modelos maiores a uma fração do custo.

Pré-lançamento

Gemini 3.5 Live Translate

Modelo de tradução de fala em tempo real e de baixa latência que oferece suporte a mais de 70 idiomas.

Novo pré-lançamento

Gemini 3.1 Flash Live

Modelo de API Live de alta qualidade e baixa latência para aplicativos de IA de diálogo em tempo real e de voz.

Novo pré-lançamento

Gemini 3.1 Flash TTS

Geração de fala avançada e de baixa latência.

Novo pré-lançamento

Gemini Omni Flash

Geração e edição de vídeos conversacionais rápidas. Transforme textos e imagens em vídeos e refine os resultados usando linguagem natural.

Novo pré-lançamento

Gemini 2.5 Flash

Nosso melhor modelo de preço-desempenho para tarefas de baixa latência e alto volume que exigem raciocínio.

Nano Banana

Geração e edição de imagens nativas de última geração projetadas para fluxos de trabalho rápidos e criativos.

Pré-lançamento do Gemini 2.5 Flash Live Preview

Otimizado para agentes conversacionais em tempo real com streaming de áudio nativo de menos de um segundo.

Pré-lançamento do Gemini 2.5 Flash TTS

Geração de áudio de conversão de texto em voz controlável com controle refinado sobre estilo e ritmo.

Gemini 2.5 Flash-Lite

O modelo multimodal mais rápido e econômico da família 2.5.

Gemini 2.5 Pro

Nosso modelo mais avançado para tarefas complexas, com recursos de raciocínio e programação.

Pré-lançamentodo Gemini 2.5 Pro TTS

Síntese de fala de alta fidelidade otimizada para qualidade em fluxos de trabalho estruturados, como podcasts e audiolivros.

Modelos de áudio

Esta seção contém todos os modelos de áudio, incluindo aqueles que já podem estar listados em outras seções

Pré-lançamento do Gemini 3.1 Flash Live Preview

Nosso modelo de áudio para áudio (A2A) de alta qualidade e baixa latência, projetado para diálogo em tempo real e aplicativos de IA de voz.

Pré-lançamento do Gemini 3.1 Flash TTS

Geração de fala avançada e de baixa latência, com saídas naturais, comandos direcionáveis e novas tags de áudio expressivas para controle preciso da narração.

Pré-lançamento do Gemini 2.5 Flash Live Preview

Nosso modelo de API Live principal para agentes de voz e vídeo bidirecionais de baixa latência com raciocínio de áudio nativo.

Pré-lançamento do Gemini 2.5 Flash TTS

Conversão de texto em voz rápida e controlável para aplicativos econômicos de baixa latência e assistentes em tempo real.

Pré-lançamentodo Gemini 2.5 Pro TTS

Síntese de fala de alta fidelidade otimizada para qualidade em fluxos de trabalho estruturados, como podcasts e audiolivros.

Modelos de mídia generativa

Esta seção contém todos os modelos de mídia generativa, incluindo aqueles que já podem estar listados em outras seções

Nano Banana 2

Criação visual de alta eficiência e escala de produção, combinando a inteligência da série Gemini 3 com velocidades de geração extremamente rápidas.

Nano Banana 2 Lite

Projetado como o especialista em eficiência da família de geração de imagens, oferecendo geração e edição de imagens econômicas e de latência ultrabaixa.

Pré-lançamentodo Veo 3.1

Geração de vídeo cinematográfico de última geração com controles criativos avançados e áudio sincronizado nativamente.

Nano Banana Pro

Um mecanismo de design profissional com um núcleo de raciocínio para recursos visuais 4K com qualidade de estúdio, layouts complexos e renderização de texto precisa.

Pré-lançamentodo Veo 3.1 Lite

Geração, edição e controle cinematográfico de vídeo de alta eficiência, baixo custo e prioridade para desenvolvedores da família Veo 3.1.

Pré-lançamento do Gemini Omni Flash

Geração e edição de vídeos conversacionais rápidas. Transforme textos e imagens em vídeos e refine os resultados usando linguagem natural.

Nano Banana

Geração e edição de imagens nativas de última geração projetadas para fluxos de trabalho rápidos e criativos.

Imagen 4 obsoleto

Modelo de texto para imagem, com geração rápida e ultrarrápida e clareza excepcional de até 2K de resolução.

Modelos de geração de música

Esta seção contém todos os modelos de geração de música, incluindo aqueles que já podem estar listados em outras seções

Pré-lançamento do Lyria 3 Pro

Nosso modelo principal de geração de música, otimizado para músicas completas com coerência estrutural complexa.

Pré-lançamento do Lyria 3 Clip

Otimizado para gerar clipes musicais curtos, loops e pré-lançamentos de até 30 segundos.

Lyria RealTime Experimental

Modelo de geração de música de alta fidelidade que oferece controle criativo granular e recursos de streaming em tempo real.

Modelos de ferramentas e agentes

Pré-lançamento do uso do computador

Um modelo especializado que pode "ver" uma tela digital e realizar ações de interface, como clicar, digitar e navegar, para automatizar tarefas complexas do navegador.

Pré-lançamento do Gemini Deep Research

Um modelo de agente que planeja e executa de forma autônoma pesquisas de várias etapas em centenas de fontes para produzir relatórios interativos com referências.

Pré-lançamento do Gemini Deep Research Max

Máxima abrangência para coleta e síntese de contexto automatizadas em centenas de fontes.

Pré-lançamentodo agente Antigravity

Um agente gerenciado de uso geral que planeja, raciocina, executa código, gerencia arquivos e navega na Web de forma autônoma em um sandbox Linux seguro e isolado.

Modelos de tarefas especializadas

Gemini Embedding 2

Nosso primeiro modelo de embedding multimodal, que mapeia texto, imagens, vídeo, áudio e PDFs em um espaço de embedding unificado para pesquisa semântica avançada e sistemas RAG.

Gemini Embedding

Representações vetoriais de alta dimensão para pesquisa semântica avançada, classificação de texto e sistemas RAG.

Pré-lançamento do Gemini Robotics-ER 1.6

Modelo avançado de raciocínio incorporado que entende espaços físicos e planeja tarefas de várias etapas para agentes robóticos com novos recursos, como leitura de instrumentos e raciocínio espacial e físico aprimorado.

Modelos anteriores

Desativação do Gemini 2.0 Flash

Nosso modelo de segunda geração, com recursos de última geração e capacidades aprimoradas, incluindo velocidade superior, uso de ferramentas nativas e uma janela de contexto de 1 milhão de tokens.

Desativação do Gemini 2.0 Flash-Lite

Nosso modelo de segunda geração mais rápido, otimizado para eficiência de custo e baixa latência.

Desativação do pré-lançamento do Gemini 3.1 Flash-Lite

Nosso modelo multimodal mais econômico, que oferece o desempenho mais rápido para tarefas leves e de alta frequência.

Desativação do pré-lançamento do Gemini 3 Pro

Nosso modelo de raciocínio de última geração, com compreensão multimodal avançada.

Padrões de nome da versão do modelo

Os modelos do Gemini estão disponíveis nas versões estável, pré-lançamento, mais recente ou experimental.

Estável

Aponta para um modelo estável específico. Os modelos estáveis geralmente não mudam. A maioria dos apps de produção precisa usar um modelo estável específico.

Por exemplo: gemini-3.5-flash.

Pré-lançamento

Aponta para um modelo de pré-lançamento que pode ser usado para produção. Os modelos de pré-lançamento normalmente têm o faturamento ativado, podem vir com limites de taxa mais restritivos e serão descontinuados com pelo menos duas semanas de antecedência.

Por exemplo: gemini-2.5-flash-preview-09-2025.

Mais recentes

Aponta para a versão mais recente de uma variação de modelo específica. Pode ser uma versão estável, de pré-lançamento ou experimental. Esse alias será trocado a quente com cada novo lançamento de uma variação de modelo específica. Para mudanças interruptivas, um aviso de duas semanas será enviado por e-mail antes que a versão mais recente seja alterada.

Por exemplo: gemini-flash-latest.

Experimental

Aponta para um modelo experimental que normalmente não é adequado para uso em produção e vem com limites de taxa mais restritivos. Lançamos modelos experimentais para coletar feedback e disponibilizar nossas atualizações mais recentes aos desenvolvedores rapidamente.

Os modelos experimentais não são estáveis, e a disponibilidade dos endpoints do modelo está sujeita a mudanças.

Descontinuações de modelos

Para informações sobre descontinuações de modelos, acesse a página de descontinuações do Gemini.