Nesta página, você encontra as atualizações da API Gemini.
28 de maio de 2026
Lançamos o
gemini-3.1-flash-image(Nano Banana 2) e ogemini-3-pro-image(Nano Banana Pro), as versões de disponibilidade geral (GA) dos nossos modelos visuais nativos, o Gemini 3.1 Flash Image e o Gemini 3.1 Pro Image.Suporte à geração de vídeo para imagem: agora você pode enviar um arquivo de vídeo (por upload direto ou como um URL público do YouTube) como contexto multimodal junto com um comando de texto para gerar miniaturas de alta qualidade, pôsteres de filmes cinematográficos ou infográficos de resumo. Esse recurso é compatível exclusivamente com o modelo
gemini-3.1-flash-image. Para saber mais, consulte o guia de Geração de vídeo para imagem.Aviso de descontinuação: os modelos
gemini-3.1-flash-image-previewegemini-3-pro-image-previewforam descontinuados e serão desativados em 25 de junho de 2026.
25 de maio de 2026
- O modelo
gemini-3.1-flash-lite-previewfoi desativado. Usegemini-3.1-flash-lite.
19 de maio de 2026
Lançamos o
gemini-3.5-flash, a versão disponível para o público em geral (GA) do Gemini 3.5 Flash, nosso modelo mais inteligente para desempenho de ponta consistente em tarefas de programação e assistidas por IA.Lançamento do Managed Agents na API Gemini em pré-lançamento público. Isso permite que desenvolvedores criem e implantem agentes autônomos com estado que são executados em ambientes de sandbox Linux seguros e isolados hospedados pelo Google. Para saber mais, consulte a página Visão geral dos agentes e o guia de início rápido.
Lançamos o agente gerenciado de uso geral Antigravity Agent,
antigravity-preview-05-2026, em pré-lançamento público. O agente Antigravity pode planejar, raciocinar, escrever e executar código de forma autônoma, gerenciar arquivos e navegar na Web dentro do contêiner de sandbox. Consulte o guia do agente antigravidade para ver exemplos de código e especificações.
7 de maio de 2026
Lançamos
gemini-3.1-flash-litea versão em disponibilidade geral (GA) do Gemini 3.1 Flash-Lite, otimizado para velocidade, escala e eficiência de custo.Aviso de descontinuação: o modelo
gemini-3.1-flash-lite-previewserá descontinuado em 11/5/26 e desativado em 25 de maio de 2026.
6 de maio de 2026
- Mudança incompatível futura: o esquema de solicitação e resposta (
outputs→steps) e a configuração do formato de saída (response_format) da API Interactions vão mudar. O novo esquema se torna o padrão em 26 de maio, e o esquema legado será removido em 8 de junho. Para mais detalhes, consulte o guia de migração.
5 de maio de 2026
- Atualização da Pesquisa de arquivos para oferecer suporte à pesquisa multimodal. Agora é possível incorporar e pesquisar imagens de forma nativa usando o modelo
gemini-embedding-2. Os metadados de embasamento agora incluemmedia_idpara citações visuais epage_numbersque indicam onde as informações são encontradas. Para saber mais, consulte o guia Pesquisa de arquivos.
4 de maio de 2026
- Lançamos o suporte a Webhooks orientados a eventos na API Gemini para substituir fluxos de trabalho de polling na API Batch e operações de longa duração.
30 de abril de 2026
- O modelo
gemini-robotics-er-1.5-previewfoi desativado. Usegemini-robotics-er-1.6-preview.
22 abril de 2026
- Lançamos o
gemini-embedding-2como disponibilidade geral (GA). Para saber mais, consulte a página Embeddings.
21 de abril de 2026
Lançamos novas versões do agente Deep Research com planejamento colaborativo, suporte à visualização, integração do servidor MCP e pesquisa de arquivos:
deep-research-preview-04-2026: projetado para velocidade e eficiência, ideal para ser transmitido de volta a uma interface do cliente.deep-research-max-preview-04-2026: máxima abrangência para coleta e síntese automatizadas de contexto.
15 de abril de 2026
- Lançamos o pré-lançamento do Gemini 3.1 Flash TTS, nosso modelo de conversão de texto em voz econômico, expressivo e controlável. Leia a documentação da Text-to-Speech para saber mais.
14 de abril de 2026
Lançamos o
gemini-robotics-er-1.6-preview, nosso modelo de robótica atualizado. Agora ele tem novos recursos, como leitura de instrumentos e capacidades aprimoradas de raciocínio espacial e físico. Para saber mais, consulte a página do Gemini Robotics-ER e o blog.Aviso de descontinuação: o modelo
gemini-robotics-er-1.5-previewserá desativado em 30 de abril de 2026 às 12h (horário de Brasília).
2 de abril de 2026
- Lançamos o
gemma-4-26b-a4b-ite ogemma-4-31b-it, disponíveis no AI Studio e na API Gemini, como parte do lançamento do Gemma 4.
1º de abril de 2026
- Lançamos os novos níveis de inferência Flex e Priority, que oferecem mais opções para otimizar custo ou latência.
31 de março de 2026
Lançamos o Veo 3.1 Lite Preview,
veo-3.1-lite-generate-preview, nosso modelo de geração de vídeo mais econômico, projetado para iteração rápida e criação de aplicativos de alto volume.O modelo
gemini-2.5-flash-lite-preview-09-2025foi desativado. Usegemini-3.1-flash-lite-previewem vez disso.
26 de março de 2026
- Lançado em
gemini-3.1-flash-live-preview, o mais recente modelo de áudio para áudio (A2A) projetado para diálogo em tempo real e aplicativos de IA que priorizam a voz. Leia a documentação da API Live para começar.
25 de março de 2026
- Lançamos os modelos de geração de música Lyria 3:
lyria-3-clip-preview(trechos de 30 segundos) elyria-3-pro-preview(músicas completas). Os dois modelos aceitam entradas de texto e imagem e geram áudio estéreo de alta qualidade em 48 kHz. Consulte o guia de Geração de música para detalhes e exemplos de código.
March 23, 2026
- Lançamos os planos de faturamento pré-pago e pós-pago no AI Studio. As contas atuais podem ser afetadas. Leia a documentação de faturamento para mais informações.
18 de março de 2026
- Lançamos o novo recurso Combinação de ferramentas integradas e chamadas de função, que permite usar as ferramentas integradas do Gemini com ferramentas personalizadas de chamadas de função em uma única chamada de API.
- O embasamento com o Google Maps agora é compatível com os modelos do Gemini 3.
16 de março de 2026
- Introduzimos os níveis de uso e os limites de gastos da conta de faturamento reformulados para melhorar a experiência de faturamento do usuário.
12 de março de 2026
- Introduzimos os limites de gastos no nível do projeto no faturamento do AI Studio.
10 de março de 2026
Lançamos o
gemini-embedding-2-preview, nosso primeiro modelo de embedding multimodal. Ele aceita entradas de texto, imagem, vídeo, áudio e PDF, mapeando todas as modalidades em um espaço de embedding unificado. Para saber mais, consulte Embeddings.Aviso de descontinuação: o modelo
gemini-2.5-flash-lite-preview-09-2025será desativado em 31 de março de 2026.
9 de março de 2026
- O modelo de pré-lançamento do Gemini 3 Pro foi desativado. Agora, o
gemini-3-pro-previewaponta paragemini-3.1-pro-preview.
3 de março de 2026
- Lançamos o pré-lançamento do Gemini 3.1 Flash-Lite, o primeiro modelo Flash-Lite da série Gemini 3. Leia a página do modelo para conferir especificações, atualizações específicas e orientações para desenvolvedores.
26 de fevereiro de 2026
Lançamos o Nano Banana 2, a prévia do Gemini 3.1 Flash Image, um modelo de alta eficiência otimizado para velocidade e casos de uso de alto volume.
Anúncio de descontinuação: o pré-lançamento do Gemini 3 Pro (
gemini-3-pro-preview) será desativado em 9 de março de 2026.
19 de fevereiro de 2026
- Lançamos o pré-lançamento do Gemini 3.1 Pro, nossa iteração mais recente da nova família da série Gemini 3.
- Lançamos um endpoint separado
gemini-3.1-pro-preview-customtools, que é melhor para priorizar ferramentas personalizadas, para usuários que criam com uma combinação de bash e ferramentas.
18 de fevereiro de 2026
Aviso de descontinuação: os modelos a seguir serão desativados em 1º de junho de 2026:
gemini-2.0-flashgemini-2.0-flash-001gemini-2.0-flash-litegemini-2.0-flash-lite-001
17 de fevereiro de 2026
Os seguintes modelos foram desativados:
gemini-2.5-flash-preview-09-25imagen-4.0-generate-preview-06-06imagen-4.0-ultra-generate-preview-06-06
29 de janeiro de 2026
- Lançamos o suporte para a ferramenta "Uso do computador" em
gemini-3-pro-previewegemini-3-flash-preview.
21 de janeiro de 2026
Mudança nos aliases de
latest:gemini-pro-latestmudou paragemini-3-pro-previewgemini-flash-latestmudou paragemini-3-flash-preview
15 de janeiro de 2026
Aviso de descontinuação: os modelos a seguir serão desativados em 17 de fevereiro de 2026:
gemini-2.5-flash-preview-09-25imagen-4.0-generate-preview-06-06imagen-4.0-ultra-generate-preview-06-06
O modelo
gemini-2.5-flash-image-previewfoi desativado.
14 de janeiro de 2026
- O modelo
text-embedding-004foi desligado.
13 de janeiro de 2026
- Adicionamos resoluções de saída 4K para o Veo e mais suporte para vídeos na vertical em todas as resoluções.
12 de janeiro de 2026
Lançamento do recurso de ciclo de vida do modelo. Alguns modelos agora especificam o estágio do ciclo de vida e o cronograma de descontinuação. Consulte a seguinte documentação para mais informações:
8 de janeiro de 2026
- Lançamos o suporte para buckets do Cloud Storage e qualquer URL pré-assinado público e privado do banco de dados como origem da entrada de dados para a API Gemini. O limite de tamanho do arquivo também aumentou de 20 MB para 100 MB. Para mais detalhes, consulte o guia de métodos de entrada de arquivos.
19 de dezembro de 2025
- Introduzimos uma mudança interruptiva na prévia pública da API Interactions na
v1beta. O campo
total_reasoning_tokensfoi renomeado comototal_thought_tokenspara se alinhar melhor ao conceito de "pensamentos" em modelos de pensamento.
17 de dezembro de 2025
Lançamos o pré-lançamento do Gemini 3 Flash,
gemini-3-flash-preview, que oferece desempenho rápido de ponta, rivalizando com modelos maiores a uma fração do custo. Com recursos aprimorados de raciocínio visual e espacial e programação baseada em agente. Leia a documentação sobre alguns novos recursos, incluindo:
12 de dezembro de 2025
- Lançamos o
gemini-2.5-flash-native-audio-preview-12-2025, um novo modelo de áudio nativo para a API Live. Essa atualização melhora a capacidade do modelo de lidar com fluxos de trabalho complexos. Para saber mais, consulte o guia da API Live e áudio nativo do Gemini 2.5 Flash.
11 de dezembro de 2025
Lançamento da API Interactions na versão Beta. Essa API oferece uma interface unificada para interagir com modelos e agentes do Gemini. Para saber mais, consulte o guia da API Interactions.
Lançamos o agente Deep Research do Gemini em prévia. Ele pode planejar, executar e sintetizar resultados de forma autônoma para tarefas de pesquisa de várias etapas. Consulte o guia Deep Research para mais detalhes.
10 de dezembro de 2025
- Lançamos melhorias nos nossos modelos de conversão de texto em voz, pré-lançamento do Gemini 2.5 Flash TTS (otimizado para baixa latência) e pré-lançamento do Gemini 2.5 Pro TTS (otimizado para qualidade), incluindo expressividade aprimorada, ritmo preciso e diálogo fluido.
9 de dezembro de 2025
- Os seguintes modelos da API Gemini Live foram desativados:
gemini-2.0-flash-live-001gemini-live-2.5-flash-preview
5 de dezembro de 2025
- O faturamento do Gemini 3 para o Embasamento com a Pesquisa Google vai começar em 5 de janeiro de 2026.
4 de dezembro de 2025
- Aviso de descontinuação: o modelo
gemini-2.5-flash-image-previewserá desativado em 15 de janeiro de 2026.
3 de dezembro de 2025
- Aviso de descontinuação: o modelo
text-embedding-004será desativado em 14 de janeiro de 2026.
20 de novembro de 2025
- Lançamos o pré-lançamento de imagens no Gemini 3 Pro,
gemini-3-pro-image-preview, a próxima iteração do modelo Nano Banana. Leia a página Geração de imagens para mais detalhes.
18 de novembro de 2025
Lançamos o primeiro modelo da série Gemini 3, o
gemini-3-pro-preview, nosso modelo de raciocínio e compreensão multimodal de última geração com recursos avançados de agentes e programação.Além das melhorias na inteligência e no desempenho, a prévia do Gemini 3 Pro apresenta um novo comportamento em relação a:
Leia o Guia do desenvolvedor do Gemini 3 para migração, novos recursos e especificações.
11 de novembro de 2025
Anúncio de descontinuação: os seguintes modelos serão desativados:
12 de novembro:
veo-3.0-fast-generate-previewveo-3.0-generate-preview
14 de novembro:
gemini-2.0-flash-exp-image-generationgemini-2.0-flash-preview-image-generation
10 de novembro de 2025
O seguinte modelo é desligado:
imagen-3.0-generate-002
Use o Imagen 4. Consulte a tabela de descontinuações do Gemini para mais detalhes.
6 de novembro de 2025
- Lançamos a API File Search em prévia pública, permitindo que os desenvolvedores baseiem as respostas nos próprios dados. Leia a nova página Pesquisa de arquivos para mais informações.
4 de novembro de 2025
No Gemini 2.5 Flash Image, a contagem de tokens de entrada para imagens foi reduzida de 1.290 para 258, diminuindo o custo da edição de imagens.
Anúncio de descontinuação: os seguintes modelos serão desativados:
18 de novembro:
gemini-2.5-flash-lite-preview-06-17gemini-2.5-flash-preview-05-20
2 de dezembro:
gemini-2.0-flash-thinking-expgemini-2.0-flash-thinking-exp-01-21gemini-2.0-flash-thinking-exp-1219gemini-2.5-pro-preview-03-25gemini-2.5-pro-preview-05-06gemini-2.5-pro-preview-06-05
9 de dezembro:
gemini-2.0-flash-lite-previewgemini-2.0-flash-lite-preview-02-05gemini-2.0-flash-expgemini-2.0-pro-expgemini-2.0-pro-exp-02-05
29 de outubro de 2025
- Lançamos a nova ferramenta geração de registros e conjuntos de dados para a API Gemini.
20 de outubro de 2025
Os seguintes modelos da API Gemini Live foram desativados:
gemini-2.5-flash-preview-native-audio-dialoggemini-2.5-flash-exp-native-audio-thinking-dialog
Em vez disso, use
gemini-2.5-flash-native-audio-preview-09-2025.Aviso de descontinuação: desligamento do
gemini-2.0-flash-live-001e dogemini-live-2.5-flash-previewem 9 de dezembro de 2025.
17 de outubro de 2025
- O embasamento com o Google Maps já está disponível para todos. Para mais informações, consulte a documentação Embasamento com o Google Maps.
15 de outubro de 2025
Lançamos os modelos Veo 3.1 e 3.1 Fast em pré-lançamento público, com novos recursos, incluindo:
- Estender vídeos criados com o Veo.
- Referenciar até três imagens para gerar um vídeo.
- Fornecer imagens do primeiro e do último frame para gerar vídeos.
Esse lançamento também adicionou mais opções de duração de vídeo de saída do Veo 3: 4, 6 e 8 segundos.
Aviso de descontinuação: encerramento do
veo-3.0-generate-previewe doveo-3.0-fast-generate-previewem 12 de novembro de 2025.
7 de outubro de 2025
- Lançamento do pré-lançamento do Gemini 2.5 Computer Use
2 de outubro de 2025
- Lançamento da disponibilidade geral do Gemini 2.5 Flash Image: Geração de imagens com o Gemini
29 de setembro de 2025
- Os seguintes modelos do Gemini 1.5 foram desativados:
gemini-1.5-progemini-1.5-flash-8bgemini-1.5-flash
25 de setembro de 2025
Lançamento do modelo Gemini Robotics-ER 1.5 em pré-lançamento. Consulte a visão geral de robótica para saber como usar o modelo no seu aplicativo de robótica.
Lançamos os seguintes modelos de prévia:
gemini-2.5-flash-preview-09-2025gemini-2.5-flash-lite-preview-09-2025
Consulte a página Modelos para mais detalhes.
23 de setembro de 2025
- Lançamos o
gemini-2.5-flash-native-audio-preview-09-2025, um novo modelo de áudio nativo para a API Live com melhorias na chamada de função e no tratamento de cortes de fala. Para saber mais, consulte o guia da API Live e áudio nativo do Gemini 2.5 Flash.
16 de setembro de 2025
Aviso de descontinuação: os seguintes modelos serão desativados em outubro de 2025:
embedding-001embedding-gecko-001gemini-embedding-exp-03-07(gemini-embedding-exp)
Consulte a página Embeddings para mais detalhes sobre o modelo de embeddings mais recente.
10 de setembro de 2025
- Lançamos suporte para o modelo de incorporações na API em lote e adicionamos a API em lote à biblioteca de compatibilidade com a OpenAI para maneiras ainda mais fáceis de começar a usar consultas em lote.
9 de setembro de 2025
- Lançamos a disponibilidade geral do Veo 3 e do Veo 3 Fast, com preços mais baixos e novas opções de proporções, resolução e geração de ideias. Leia a documentação do Veo para mais informações.
26 de agosto de 2025
- Lançamos a prévia de imagens do Gemini 2.5, nosso modelo de geração de imagens nativo mais recente.
18 de agosto de 2025
- Lançamos a ferramenta de contexto de URL para disponibilidade geral (GA), que fornece URLs como contexto adicional para comandos. O suporte para usar o contexto de URL com o modelo
gemini-2.0-flash(disponível durante o lançamento experimental) será descontinuado em uma semana.
14 de agosto de 2025
- Lançamos os modelos Ultra, Standard e Fast do Imagen 4 com disponibilidade geral (GA). Para saber mais, consulte a página Imagen.
7 de agosto de 2025
allow_adultna geração de imagens em vídeo agora estão disponíveis em regiões restritas. Consulte a página do Veo para mais detalhes.
31 de julho de 2025
- Lançamos a geração de vídeo com base em imagens para o modelo Veo 3 Preview.
- Lançamento do modelo Veo 3 Fast Preview.
- Para saber mais sobre o Veo 3, acesse a página do Veo.
22 de julho de 2025
- Lançamos o
gemini-2.5-flash-lite, nosso modelo Gemini 2.5 rápido, de baixo custo e alto desempenho. Para saber mais, consulte Gemini 2.5 Flash Lite.
17 de julho de 2025
Lançamos o
veo-3.0-generate-preview, a atualização mais recente do Veo, que apresenta a geração de vídeos com áudio. Para saber mais sobre o Veo 3, acesse a página do Veo.Aumento dos limites de taxa para o Imagen 4 Standard e Ultra. Acesse a página Limites de taxa para mais detalhes.
14 de julho de 2025
- Lançamos o
gemini-embedding-001, a versão estável do nosso modelo de embedding de texto. Para saber mais, consulte embeddings. O modelogemini-embedding-exp-03-07será desativado em 14 de agosto de 2025.
7 de julho de 2025
- Lançamos o modo em lote da API Gemini. Agrupe as solicitações e envie-as para processamento de forma assíncrona. Para saber mais, consulte Modo em lote.
26 de junho de 2025
Os modelos de prévia
gemini-2.5-pro-preview-05-06egemini-2.5-pro-preview-03-25agora estão redirecionando para a versão estável mais recentegemini-2.5-pro.gemini-2.5-pro-exp-03-25está desligado.
24 de junho de 2025
- Lançamento dos modelos de prévia do Imagen 4 Ultra e Standard. Para saber mais, consulte a página Geração de imagens.
17 de junho de 2025
- Lançamos o
gemini-2.5-pro, a versão estável do nosso modelo mais avançado, agora com raciocínio adaptativo. Para saber mais, consulte Gemini 2.5 Pro e Pensamento. Ogemini-2.5-pro-preview-05-06será redirecionado paragemini-2.5-proem 26 de junho de 2025. - Lançamos o
gemini-2.5-flash, nosso primeiro modelo 2.5 Flash estável. Para saber mais, consulte Gemini 2.5 Flash. Ogemini-2.5-flash-preview-04-17será descontinuado em 15 de julho de 2025. - Lançamos o
gemini-2.5-flash-lite-preview-06-17, um modelo do Gemini 2.5 de baixo custo e alto desempenho. Para saber mais, consulte o pré-lançamento do Gemini 2.5 Flash-Lite.
5 de junho de 2025
- Lançamos o
gemini-2.5-pro-preview-06-05, uma nova versão do nosso modelo mais avançado, agora com pensamento adaptativo. Para saber mais, consulte Prévia do Gemini 2.5 Pro e Pensamento.gemini-2.5-pro-preview-05-06será redirecionado paragemini-2.5-proem 26 de junho de 2025.
27 de maio de 2025
- O último modelo de ajuste disponível, o Gemini 1.5 Flash 001, foi desativado. O ajuste não é mais compatível com nenhum modelo. Consulte Ajuste refinado com a API Gemini.
20 de maio de 2025
Atualizações da API:
- Lançamos o suporte para pré-processamento de vídeo personalizado usando intervalos de corte e amostragem de frame rate configurável.
- Lançamos o uso de várias ferramentas, que permite configurar a execução de código e o embasamento com a Pesquisa Google na mesma solicitação
generateContent. - Lançamos o suporte para chamadas de função assíncronas na API Live.
- Lançamos uma ferramenta experimental de contexto de URL para fornecer URLs como contexto adicional aos comandos.
Atualizações do modelo:
- Lançamos o
gemini-2.5-flash-preview-05-20, um modelo de prévia do Gemini otimizado para custo-benefício e pensamento adaptativo. Para saber mais, consulte Pré-lançamento do Gemini 2.5 Flash e Pensando. - Lançamos os modelos
gemini-2.5-pro-preview-ttsegemini-2.5-flash-preview-ttsque podem gerar fala com um ou dois interlocutores. - Lançamos o modelo
lyria-realtime-exp, que gera músicas em tempo real. - Lançamos
gemini-2.5-flash-preview-native-audio-dialogegemini-2.5-flash-exp-native-audio-thinking-dialog, novos modelos do Gemini para a API Live com recursos de saída de áudio nativo. Para saber mais, consulte o guia da API Live e o áudio nativo do Gemini 2.5 Flash. - Lançamos a prévia
gemma-3n-e4b-it, disponível no AI Studio e pela API Gemini, como parte do lançamento do Gemma 3n.
7 de maio de 2025
- Lançamos o
gemini-2.0-flash-preview-image-generation, um modelo de prévia para gerar e editar imagens. Para saber mais, consulte Geração de imagens e Geração de imagens da prévia do Gemini 2.0 Flash.
6 de maio de 2025
- Lançamos o
gemini-2.5-pro-preview-05-06, uma nova versão do nosso modelo mais avançado, com melhorias no código e na chamada de função.gemini-2.5-pro-preview-03-25vai apontar automaticamente para a nova versão do modelo.
17 de abril de 2025
- Lançamos o
gemini-2.5-flash-preview-04-17, um modelo de prévia do Gemini otimizado para custo-benefício e pensamento adaptativo. Para saber mais, consulte Pré-lançamento do Gemini 2.5 Flash e Pensando.
16 de abril de 2025
- Lançamos o cache de contexto para o Gemini 2.0 Flash.
9 de abril de 2025
Atualizações do modelo:
- Lançamos o
veo-2.0-generate-001, um modelo de texto e imagem para vídeo com disponibilidade geral (GA) capaz de gerar vídeos detalhados e com nuances artísticas. Para saber mais, consulte a documentação do Veo. Lançamos o
gemini-2.0-flash-live-001, uma versão de prévia pública do modelo da API Live com o faturamento ativado.Gerenciamento e confiabilidade de sessões aprimorados
- Retomada de sessão:mantém as sessões ativas durante interrupções temporárias na rede. A API agora oferece suporte ao armazenamento do estado da sessão no lado do servidor (por até 24 horas) e fornece identificadores (session_resumption) para reconectar e retomar de onde você parou.
- Sessões mais longas com compactação de contexto:permite interações mais longas do que os limites de tempo anteriores. Configure a compactação da janela de contexto com um mecanismo de janela deslizante para gerenciar automaticamente o tamanho do contexto, evitando encerramentos abruptos devido a limites de contexto.
- Notificação de desconexão normal:receba uma mensagem do servidor
GoAwayindicando quando uma conexão está prestes a ser fechada, permitindo um processamento normal antes do encerramento.
Mais controle sobre a dinâmica de interação
Detecção de atividade de voz (VAD) configurável: escolha níveis de sensibilidade ou desative a VAD automática e use novos eventos de cliente (
activityStart,activityEnd) para controle manual de turnos.Processamento de interrupção configurável:decida se a entrada do usuário deve interromper a resposta do modelo.
Cobertura de turno configurável:escolha se a API processa todas as entradas de áudio e vídeo continuamente ou apenas as captura quando o usuário final é detectado falando.
Resolução de mídia configurável:otimize a qualidade ou o uso de tokens selecionando a resolução da mídia de entrada.
Saída e recursos mais avançados
Opções de voz e idioma expandidas:escolha entre duas novas vozes e 30 novos idiomas para saída de áudio. O idioma de saída agora pode ser configurado em
speechConfig.Streaming de texto:receba respostas de texto de forma incremental à medida que são geradas, permitindo uma exibição mais rápida para o usuário.
Relatórios de uso de tokens:receba insights sobre o uso com contagens detalhadas de tokens fornecidas no campo
usageMetadatadas mensagens do servidor, divididas por modalidade e fases de comando ou resposta.
4 de abril de 2025
- Lançamos
gemini-2.5-pro-preview-03-25, uma versão de pré-lançamento público do Gemini 2.5 Pro com o faturamento ativado. Você pode continuar usando ogemini-2.5-pro-exp-03-25no nível sem custo financeiro.
25 de março de 2025
- Lançamos o
gemini-2.5-pro-exp-03-25, um modelo experimental público do Gemini com o modo de raciocínio sempre ativado por padrão. Para saber mais, consulte Gemini 2.5 Pro Experimental.
12 de março de 2025
Atualizações do modelo:
- Lançamos um modelo experimental do Gemini 2.0 Flash capaz de gerar e editar imagens.
- Lançado em
gemma-3-27b-it, disponível no AI Studio e pela API Gemini, como parte do lançamento do Gemma 3.
Atualizações da API:
- Adição de compatibilidade com URLs do YouTube como uma fonte de mídia.
- Agora é possível incluir um vídeo inline de menos de 20 MB.
March 11, 2025
Atualizações do SDK:
- Lançamos o SDK de IA Generativa do Google para TypeScript e JavaScript em pré-lançamento público.
7 de março de 2025
Atualizações do modelo:
- Lançamos o
gemini-embedding-exp-03-07, um modelo de embeddings experimental baseado no Gemini em pré-lançamento público.
28 de fevereiro de 2025
Atualizações da API:
- Suporte para Pesquisa como uma ferramenta
adicionado ao
gemini-2.0-pro-exp-02-05, um modelo experimental baseado no Gemini 2.0 Pro.
25 de fevereiro de 2025
Atualizações do modelo:
- Lançamos
gemini-2.0-flash-lite, uma versão em disponibilidade geral (GA) do Gemini 2.0 Flash-Lite, que é otimizado para velocidade, escala e eficiência de custo.
19 de fevereiro de 2025
Atualizações do AI Studio:
- Suporte para mais regiões (Kosovo, Groenlândia e Ilhas Faroé).
Atualizações da API:
- Suporte para mais regiões (Kosovo, Groenlândia e Ilhas Faroé).
18 de fevereiro de 2025
Atualizações do modelo:
- O Gemini 1.0 Pro não está mais disponível. Para conferir a lista de modelos compatíveis, consulte Modelos do Gemini.
11 de fevereiro de 2025
Atualizações da API:
- Atualizações sobre a compatibilidade das bibliotecas da OpenAI.
6 de fevereiro de 2025
Atualizações do modelo:
- Lançamos em
imagen-3.0-generate-002uma versão com disponibilidade geral (GA) do Imagen 3 na API Gemini.
Atualizações do SDK:
- Lançamos o SDK de IA Generativa do Google para Java em pré-lançamento público.
5 de fevereiro de 2025
Atualizações do modelo:
- Lançamos o
gemini-2.0-flash-001, uma versão de disponibilidade geral (GA) do Gemini 2.0 Flash que aceita saída somente de texto. - Lançamos em
gemini-2.0-pro-exp-02-05uma versão de prévia pública experimental do Gemini 2.0 Pro. - Lançamos o
gemini-2.0-flash-lite-preview-02-05, um modelo de prévia pública experimental otimizado para eficiência de custos.
Atualizações da API:
- Adição de suporte para entrada de arquivo e saída de gráfico na execução de código.
Atualizações do SDK:
- Lançamos o SDK de IA generativa do Google para Python para disponibilidade geral (GA).
21 de janeiro de 2025
Atualizações do modelo:
- Lançamos
gemini-2.0-flash-thinking-exp-01-21, a versão de prévia mais recente do modelo por trás do modelo Gemini 2.0 Flash Raciocínio.
December 19, 2024
Atualizações do modelo:
Lançamos o modo Gemini 2.0 Flash Raciocínio em pré-lançamento público. O Modo de pensamento é um modelo de computação de tempo de teste que permite ver o processo de raciocínio do modelo enquanto ele gera uma resposta e produz respostas com recursos de raciocínio mais fortes.
Leia mais sobre o modo Gemini 2.0 Flash Raciocínio na nossa página de visão geral.
11 de dezembro de 2024
Atualizações do modelo:
- Lançamos o Gemini 2.0 Flash Experimental
em pré-lançamento público. A lista parcial de recursos do Gemini 2.0 Flash Experimental inclui:
- Duas vezes mais rápido que o Gemini 1.5 Pro
- Streaming bidirecional com nossa API Live
- Geração de respostas multimodais em forma de texto, imagens e fala
- Uso de ferramentas integradas com raciocínio multiturno para usar recursos como execução de código, pesquisa, chamada de função e muito mais
Leia mais sobre o Gemini 2.0 Flash na nossa página de visão geral.
21 de novembro de 2024
Atualizações do modelo:
- Lançamos o
gemini-exp-1121, um modelo experimental da API Gemini ainda mais avançado.
Atualizações do modelo:
- Atualizamos os aliases de modelo
gemini-1.5-flash-latestegemini-1.5-flashpara usargemini-1.5-flash-002.- Mudança no parâmetro
top_k: o modelogemini-1.5-flash-002aceita valores detop_kentre 1 e 41 (exclusivo). Valores maiores que 40 serão alterados para 40.
- Mudança no parâmetro
14 de novembro de 2024
Atualizações do modelo:
- Lançamos o
gemini-exp-1114, um modelo experimental avançado da API Gemini.
8 de novembro de 2024
Atualizações da API:
- Adicionamos suporte ao Gemini nas bibliotecas da OpenAI / API REST.
31 de outubro de 2024
Atualizações da API:
3 de outubro de 2024
Atualizações do modelo:
- Lançamos o
gemini-1.5-flash-8b-001, uma versão estável do nosso menor modelo da API Gemini.
24 de setembro de 2024
Atualizações do modelo:
- Lançamos o
gemini-1.5-pro-002e ogemini-1.5-flash-002, duas novas versões estáveis do Gemini 1.5 Pro e 1.5 Flash, para disponibilidade geral. - Atualizamos o código do modelo
gemini-1.5-pro-latestpara usargemini-1.5-pro-002e o código do modelogemini-1.5-flash-latestpara usargemini-1.5-flash-002. - Lançamos
gemini-1.5-flash-8b-exp-0924para substituirgemini-1.5-flash-8b-exp-0827. - Lançamos o filtro de segurança de integridade cívica para a API Gemini e o AI Studio.
- Lançamos suporte para dois novos parâmetros do Gemini 1.5 Pro e 1.5 Flash em
Python e NodeJS:
frequencyPenaltyepresencePenalty.
19 de setembro de 2024
Atualizações do AI Studio:
- Adicionamos botões de "Gostei" e "Não gostei" às respostas do modelo para que os usuários possam dar feedback sobre a qualidade de uma resposta.
Atualizações da API:
- Adicionamos suporte para créditos do Google Cloud, que agora podem ser usados para o uso da API Gemini.
17 de setembro de 2024
Atualizações do AI Studio:
- Adicionamos um botão Abrir no Colab que exporta um comando e o código para executá-lo em um notebook do Colab. O recurso ainda não é compatível com solicitações com ferramentas (modo JSON, chamada de função ou execução de código).
13 de setembro de 2024
Atualizações do AI Studio:
- Adicionamos suporte ao modo de comparação, que permite comparar respostas em vários modelos e comandos para encontrar a melhor opção para seu caso de uso.
30 de agosto de 2024
Atualizações do modelo:
- O Gemini 1.5 Flash permite fornecer um esquema JSON pela configuração do modelo.
27 de agosto de 2024
Atualizações do modelo:
- Lançamos os seguintes modelos experimentais:
gemini-1.5-pro-exp-0827gemini-1.5-flash-exp-0827gemini-1.5-flash-8b-exp-0827
9 de agosto de 2024
Atualizações da API:
- Adição de compatibilidade com o processamento de PDF.
5 de agosto de 2024
Atualizações do modelo:
- Lançamento do suporte ao ajuste refinado para o Gemini 1.5 Flash.
1º de agosto de 2024
Atualizações do modelo:
- Lançamos
gemini-1.5-pro-exp-0801, uma nova versão experimental do Gemini 1.5 Pro.
12 de julho de 2024
Atualizações do modelo:
- O suporte ao Gemini 1.0 Pro Vision foi removido dos serviços e ferramentas de IA do Google.
27 de junho de 2024
Atualizações do modelo:
- Versão de disponibilidade geral da janela de contexto de 2 milhões do Gemini 1.5 Pro.
Atualizações da API:
- Agora é possível fazer a execução de código.
18 de junho de 2024
Atualizações da API:
- Adição de suporte para armazenamento em cache de contexto.
12 de junho de 2024
Atualizações do modelo:
- O Gemini 1.0 Pro Vision foi descontinuado.
23 de maio de 2024
Atualizações do modelo:
- O Gemini 1.5 Pro
(
gemini-1.5-pro-001) está em disponibilidade geral (GA). - O Gemini 1.5 Flash
(
gemini-1.5-flash-001) está em disponibilidade geral (GA).
14 de maio de 2024
Atualizações da API:
- Lançamos uma janela de contexto de 2 milhões para o Gemini 1.5 Pro (lista de espera).
- Lançamos o faturamento com pagamento por uso para o Gemini 1.0 Pro. Em breve, o faturamento do Gemini 1.5 Pro e do Gemini 1.5 Flash também estará disponível.
- Aumento dos limites de taxa para o próximo nível pago do Gemini 1.5 Pro.
- Adicionamos suporte a vídeo integrado à API File.
- Adição de suporte a texto simples à API File.
- Adição de suporte à chamada de função paralela, que retorna mais de uma chamada por vez.
10 de maio de 2024
Atualizações do modelo:
- Lançamos o Gemini 1.5 Flash
(
gemini-1.5-flash-latest) em pré-lançamento.
9 de abril de 2024
Atualizações do modelo:
- Lançamos o Gemini 1.5 Pro
(
gemini-1.5-pro-latest) em pré-lançamento. - Lançamos um novo modelo de embedding de texto, o
text-embeddings-004, que oferece suporte a tamanhos de embedding elástico abaixo de 768.
Atualizações da API:
- Lançamos a API File para armazenar temporariamente arquivos de mídia para uso em solicitações.
- Adicionamos suporte para comandos com dados de texto, imagem e áudio, também conhecidos como comandos multimodais. Para saber mais, consulte Comandos com mídia.
- Lançamos as Instruções do sistema em beta.
- Adicionamos o modo de chamada de função, que define o comportamento de execução para a chamada de função.
- Adicionamos suporte à opção de configuração
response_mime_type, que permite solicitar respostas em formato JSON.
19 de março de 2024
Atualizações do modelo:
- Adicionamos suporte para ajustar o Gemini 1.0 Pro no Google AI Studio ou com a API Gemini.
13 de dezembro de 2023
Atualizações do modelo:
- gemini-pro: novo modelo de texto para uma ampla variedade de tarefas. Equilibra capacidade e eficiência.
- gemini-pro-vision: novo modelo multimodal para uma ampla variedade de tarefas. Equilibra capacidade e eficiência.
- embedding-001: novo modelo de embeddings.
- aqa: um novo modelo especialmente ajustado e treinado para responder a perguntas usando passagens de texto para embasar as respostas geradas.
Consulte Modelos do Gemini para mais detalhes.
Atualizações da versão da API:
- v1: o canal estável da API.
- v1beta: canal Beta. Este canal tem recursos que podem estar em desenvolvimento.
Consulte o tópico sobre versões da API para mais detalhes.
Atualizações da API:
- O
GenerateContenté um único endpoint unificado para chat e texto. - Streaming disponível pelo método
StreamGenerateContent. - Recurso multimodal: a imagem é uma nova modalidade compatível
- Novos recursos Beta:
- Chamada de função
- Semantic Retriever
- Respostas a perguntas atribuídas (AQA)
- Contagem de candidatos atualizada: os modelos do Gemini retornam apenas um candidato.
- Diferentes configurações de segurança e categorias de classificação de segurança. Consulte as configurações de segurança para mais detalhes.
- O ajuste de modelos ainda não está disponível para modelos do Gemini (em andamento).