O Embasamento com a Pesquisa Google já está disponível. Saiba mais

Esta página foi traduzida pela API Cloud Translation.

Modelos do Gemini!

1.5 Flash

Nosso modelo multimodal mais equilibrado, com ótimo desempenho para a maioria das tarefas

Inserir áudio, imagens, vídeo e texto e receber respostas em texto
Gerar código, extrair dados, editar texto e muito mais
Ideal para tarefas que exigem equilíbrio entre desempenho e custo

1.5 Flash-8B

Nosso modelo multimodal mais rápido e econômico com ótimo desempenho para tarefas de alta frequência

Inserir áudio, imagens, vídeo e texto e receber respostas em texto
Gerar código, extrair dados, editar texto e muito mais
Ideal para tarefas de baixa inteligência e alta frequência

1.5 Pro

Nosso modelo multimodal com melhor desempenho e recursos para uma ampla variedade de tarefas de raciocínio

Inserir áudio, imagens, vídeo e texto e receber respostas em texto
Gerar código, extrair dados, editar texto e muito mais
Para quando você precisar de um impulso na performance

Variantes de modelo

A API Gemini oferece diferentes modelos otimizados para casos de uso específicos. Confira uma breve descrição das variantes do Gemini disponíveis:

Variante do modelo	Entrada(s)	Saída	Otimizado para
Gemini 1.5 Flash `gemini-1.5-flash`	Áudio, imagens, vídeos e texto	Texto	Desempenho rápido e versátil em várias tarefas
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	Áudio, imagens, vídeos e texto	Texto	Tarefas de alto volume e baixa inteligência
Gemini 1.5 Pro `gemini-1.5-pro`	Áudio, imagens, vídeos e texto	Texto	Tarefas de raciocínio complexas que exigem mais inteligência
Gemini 1.0 Pro (descontinuado em 15/02/2025) `gemini-1.0-pro`	Texto	Texto	Tarefas de linguagem natural, chat de código e texto com várias interações e geração de código
Incorporação de texto `text-embedding-004`	Texto	Embeddings de textos	Como medir a relação entre strings de texto
AQA `aqa`	Texto	Texto	Fornecer respostas com base em fontes confiáveis

Gemini 1.5 Flash

O Gemini 1.5 Flash é um modelo multimodal rápido e versátil para escalonamento em diversas tarefas.

Testar no AI Studio

Detalhes do modelo

Propriedade	Descrição
Código do modelo	`models/gemini-1.5-flash`
tipos de dados com suporte	Entradas (link em inglês) Áudio, imagens, vídeo e texto Saída Texto
Limites de token^[*]	Limite de tokens de entrada 1.048.576 Limite de token de saída 8.192
Especificações de áudio/visual	Número máximo de imagens por comando 3.600 Duração máxima do vídeo 1 hora Comprimento máximo do áudio Aproximadamente 9,5 horas
Limites de taxa^[**]	Sem custo financeiro 15 RPM 1 milhão de TPM 1.500 RPD Pay-as-you-go:: 2.000 RPM 4 milhões de TPM
Recursos de	Instruções do sistema Compatível Modo JSON Compatível Esquema JSON Compatível Configurações de segurança ajustáveis Compatível Armazenamento em cache Compatível Ajuste Compatível Chamadas de função Compatível Execução de código Compatível
Versões	Leia os padrões de versão do modelo para mais detalhes. Mais recente: `gemini-1.5-flash-latest` Versão estável mais recente: `gemini-1.5-flash` Estável: `gemini-1.5-flash-001` `gemini-1.5-flash-002` Experimental: `gemini-1.5-flash-8b-exp-0924` `gemini-1.5-flash-8b-exp-0827` `gemini-1.5-flash-exp-0827`
Atualização mais recente	Setembro de 2024

Gemini 1.5 Flash-8B

O Gemini 1.5 Flash-8B é um modelo pequeno projetado para tarefas de baixa inteligência.

Testar no AI Studio

Detalhes do modelo

Propriedade	Descrição
Código do modelo	`models/gemini-1.5-flash-8b`
tipos de dados com suporte	Entradas (link em inglês) Áudio, imagens, vídeo e texto Saída Texto
Limites de token^[*]	Limite de tokens de entrada 1.048.576 Limite de token de saída 8.192
Especificações de áudio/visual	Número máximo de imagens por comando 3.600 Duração máxima do vídeo 1 hora Comprimento máximo do áudio Aproximadamente 9,5 horas
Limites de taxa^[**]	Sem custo financeiro 15 RPM 1 milhão de TPM 1.500 RPD Pay-as-you-go:: 4.000 RPM 4 milhões de TPM
Recursos de	Instruções do sistema Compatível Modo JSON Compatível Esquema JSON Compatível Configurações de segurança ajustáveis Compatível Armazenamento em cache Compatível Ajuste Compatível Chamadas de função Compatível Execução de código Compatível
Versões	Leia os padrões de versão do modelo para mais detalhes. Mais recente: `gemini-1.5-flash-8b-latest` Versão estável mais recente: `gemini-1.5-flash-8b` Estável: `gemini-1.5-flash-8b-001`
Atualização mais recente	Outubro de 2024

Gemini 1.5 Pro

O Gemini 1.5 Pro é um modelo multimodal de tamanho médio otimizado para uma ampla variedade de tarefas de raciocínio. O 1.5 Pro pode processar grandes quantidades de dados de uma vez, incluindo duas horas de vídeo, 19 horas de áudio, bases de código com 60.000 linhas de código ou 2.000 páginas de texto.

Testar no AI Studio

Detalhes do modelo

Propriedade	Descrição
Código do modelo	`models/gemini-1.5-pro`
tipos de dados com suporte	Entradas (link em inglês) Áudio, imagens, vídeo e texto Saída Texto
Limites de token^[*]	Limite de tokens de entrada 2.097.152 Limite de token de saída 8.192
Especificações de áudio/visual	Número máximo de imagens por comando 7.200 Duração máxima do vídeo 2 horas Comprimento máximo do áudio Aproximadamente 19 horas
Limites de taxa^[**]	Sem custo financeiro 2 RPM 32.000 TPM 50 RPD Pay-as-you-go:: 1.000 RPM 4 milhões de TPM
Recursos de	Instruções do sistema Compatível Modo JSON Compatível Esquema JSON Compatível Configurações de segurança ajustáveis Compatível Armazenamento em cache Compatível Ajuste incompatível Chamadas de função Compatível Execução de código Compatível
Versões	Leia os padrões de versão do modelo para mais detalhes. Mais recente: `gemini-1.5-pro-latest` Versão estável mais recente: `gemini-1.5-pro` Estável: `gemini-1.5-pro-001` `gemini-1.5-pro-002` Experimental: `gemini-1.5-pro-exp-0827`
Atualização mais recente	Setembro de 2024

Gemini 1.0 Pro (descontinuado)

O Gemini 1.0 Pro é um modelo de PLN que processa tarefas como chat de código e texto com várias interações e geração de código.

Testar no AI Studio

Detalhes do modelo

Propriedade	Descrição
Código do modelo	`models/gemini-1.0-pro`
tipos de dados com suporte	Entrada Texto Saída Texto
Limites de taxa^[**]	Sem custo financeiro 15 RPM 32.000 TPM 1.500 RPD Pay-as-you-go:: 360 RPM 120.000 TPM 30.000 RPD
Recursos de	Instruções do sistema incompatível Modo JSON incompatível Esquema JSON incompatível Configurações de segurança ajustáveis Compatível Armazenamento em cache incompatível Ajuste Compatível Chamadas de função Compatível Configuração de chamadas de função incompatível Execução de código incompatível
Versões	Mais recente: `gemini-1.0-pro-latest` Versão estável mais recente: `gemini-1.0-pro` Estável: `gemini-1.0-pro-001`
Atualização mais recente	Fevereiro de 2024

Observação:gemini-pro é um alias de gemini-1.0-pro.

Incorporação de texto e embedding

Incorporação de texto

As incorporações de texto são usadas para medir a relação entre strings e são amplamente utilizadas em muitos aplicativos de IA.

O text-embedding-004 alcança uma performance de recuperação mais forte e supera os modelos atuais com dimensões semelhantes, nos comparativos de referência de incorporação do MTEB padrão.

Detalhes do modelo

Propriedade	Descrição
Código do modelo	API Gemini `models/text-embedding-004`
tipos de dados com suporte	Entrada Texto Saída Embeddings de textos
Limites de token^[*]	Limite de tokens de entrada 2.048 Tamanho da dimensão de saída 768
Limites de taxa^[**]	1.500 solicitações por minuto
Configurações de segurança ajustáveis	incompatível
Atualização mais recente	Abril de 2024

Incorporação

Você pode usar o modelo de embedding para gerar embeddings de texto para textos de entrada.

O modelo de embedding é otimizado para criar embeddings com 768 dimensões para textos de até 2.048 tokens.

Detalhes do modelo de embedding

Propriedade	Descrição
Código do modelo	`models/embedding-001`
tipos de dados com suporte	Entrada Texto Saída Embeddings de textos
Limites de token^[*]	Limite de tokens de entrada 2.048 Tamanho da dimensão de saída 768
Limites de taxa^[**]	1.500 solicitações por minuto
Configurações de segurança ajustáveis	incompatível
Atualização mais recente	Dezembro de 2023

AQA

É possível usar o modelo AQA para realizar tarefas relacionadas a respostas a perguntas atribuídas (AQA, na sigla em inglês) em um documento, corpus ou conjunto de passagens. O modelo AQA retorna respostas para perguntas com base nas fontes fornecidas, além de estimar a probabilidade de resposta.

Detalhes do modelo

Propriedade	Descrição
Código do modelo	`models/aqa`
tipos de dados com suporte	Entrada Texto Saída Texto
Idioma com suporte	Inglês
Limites de token^[*]	Limite de tokens de entrada 7.168 Limite de token de saída 1.024
Limites de taxa^[**]	1.500 solicitações por minuto
Configurações de segurança ajustáveis	Compatível
Atualização mais recente	Dezembro de 2023

Consulte os exemplos para conhecer os recursos dessas variações de modelo.

[*] Um token equivale a cerca de quatro caracteres para modelos Gemini. 100 tokens equivalem a cerca de 60 a 80 palavras em inglês.

[**] RPM: solicitações por minuto
TPM: tokens por minuto
RPD: solicitações por dia
TPD: tokens por dia

Devido a limitações de capacidade, os limites máximos de taxa especificados não são garantidos.

Padrões de nome de versão do modelo

Os modelos do Gemini estão disponíveis nas versões de pré-lançamento ou estáveis. No seu código, use um dos formatos de nome de modelo a seguir para especificar qual modelo e versão você quer usar.

Mais recente:aponta para a versão mais recente do modelo para uma geração e variação especificadas. O modelo subjacente é atualizado regularmente e pode ser uma versão de pré-lançamento. Apenas apps de teste exploratório e protótipos devem usar esse alias.

Para especificar a versão mais recente, use o seguinte padrão: <model>-<generation>-<variation>-latest. Por exemplo, gemini-1.0-pro-latest.
Versão estável mais recente:aponta para a versão estável mais recente lançada para a geração e variação do modelo especificado.

Para especificar a versão estável mais recente, use o seguinte padrão: <model>-<generation>-<variation>. Por exemplo, gemini-1.0-pro.
Estável:aponta para um modelo estável específico. Os modelos estáveis não mudam. A maioria dos apps de produção precisa usar um modelo estável específico.

Para especificar uma versão estável, use o seguinte padrão: <model>-<generation>-<variation>-<version>. Por exemplo, gemini-1.0-pro-001.
Experimental:aponta para um modelo experimental disponível na prévia, conforme definido nos Termos, ou seja, não é para uso em produção. Lançamos modelos experimentais para coletar feedback, disponibilizar nossas atualizações mais recentes aos desenvolvedores rapidamente e destacar o ritmo de inovação do Google. O que aprendemos com os lançamentos experimentais informa como lançamos os modelos de forma mais ampla. Um modelo experimental pode ser trocado por outro sem aviso prévio. Não garantimos que um modelo experimental se torne um modelo estável no futuro.

Para especificar uma versão experimental, use o seguinte padrão: <model>-<generation>-<variation>-<version>. Por exemplo, gemini-1.5-pro-exp-0827.

Idiomas disponíveis

Os modelos do Gemini são treinados para funcionar com os seguintes idiomas:

Árabe (ar)
Bengalês (bn)
Búlgaro (bg)
Chinês (simplificado e tradicional) (zh)
Croata (hr)
República Tcheca (cs)
Coreano (da)
Holandês (nl)
Inglês (en)
Estoniano (et)
Finlandês (fi)
Francês (fr)
Alemão (de)
Grego (el)
Hebraico (iw)
Hindi (hi)
Húngaro (hu)
Indonésio (id)
Italiano (it)
Japonês (ja)
Coreano (ko)
Letão (lv)
Lituano (lt)
Norueguês (no)
Polonês (pl)
Português (pt)
Romeno (ro)
Russo (ru)
Sérvio (sr)
Eslovaco (sk)
Esloveno (sl)
Espanhol (es)
Suaíli (sw)
Sueco (sv)
Tailandês (th)
Turco (tr)
Ucraniano (uk)
Vietnamita (vi)