Modelos do Gemini

Variantes de modelo

A API Gemini oferece diferentes modelos otimizados para casos de uso específicos. Confira uma breve descrição das variantes disponíveis do Gemini:

Variante do modelo Entrada(s) Saída Otimizado para
Gemini 1.5 Flash
gemini-1.5-flash
Áudio, imagens, vídeos e texto Texto Desempenho rápido e versátil em várias tarefas
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
Áudio, imagens, vídeos e texto Texto Tarefas de alto volume e baixa inteligência
Gemini 1.5 Pro
gemini-1.5-pro
Áudio, imagens, vídeos e texto Texto Tarefas de raciocínio complexas que exigem mais inteligência
Gemini 1.0 Pro (descontinuado em 15/02/2025)
gemini-1.0-pro
Texto Texto Tarefas de linguagem natural, chat de código e texto com várias interações e geração de código
Incorporação de texto
text-embedding-004
Texto Embeddings de textos Como medir a relação entre strings de texto
AQA
aqa
Texto Texto Fornecer respostas com base em fontes confiáveis

Gemini 1.5 Flash

O Gemini 1.5 Flash é um modelo multimodal rápido e versátil para escalonamento em diversas tarefas.

Testar no AI Studio

Detalhes do modelo

Propriedade Descrição
Código do modelo models/gemini-1.5-flash
tipos de dados com suporte

Entradas (link em inglês)

Áudio, imagens, vídeo e texto

Saída

Texto

Limites de token[*]

Limite de tokens de entrada

1.048.576

Limite de token de saída

8.192

Especificações de áudio/visual

Número máximo de imagens por comando

3.600

Duração máxima do vídeo

1 hora

Duração máxima do áudio

Aproximadamente 9,5 horas

Limites de taxa[**]
Sem custo financeiro
  • 15 RPM
  • 1 milhão de TPM
  • 1.500 RPD
Pay-as-you-go:
  • 2.000 RPM
  • 4 milhões de TPM
(em inglês)

Instruções do sistema

Compatível

Modo JSON

Compatível

Esquema JSON

Compatível

Configurações de segurança ajustáveis

Compatível

Armazenamento em cache

Compatível

Ajuste

Compatível

Chamadas de função

Compatível

Execução de código

Compatível

Versões
Leia os padrões de versão do modelo para mais detalhes.
  • Mais recente: gemini-1.5-flash-latest
  • Versão estável mais recente: gemini-1.5-flash
  • Estável:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Atualização mais recente Setembro de 2024

Gemini 1.5 Flash-8B

O Gemini 1.5 Flash-8B é um modelo pequeno projetado para tarefas de baixa inteligência.

Testar no AI Studio

Detalhes do modelo

Propriedade Descrição
Código do modelo models/gemini-1.5-flash-8b
tipos de dados com suporte

Entradas (link em inglês)

Áudio, imagens, vídeo e texto

Saída

Texto

Limites de token[*]

Limite de tokens de entrada

1.048.576

Limite de token de saída

8.192

Especificações de áudio/visual

Número máximo de imagens por comando

3.600

Duração máxima do vídeo

1 hora

Duração máxima do áudio

Aproximadamente 9,5 horas

Limites de taxa[**]
Sem custo financeiro
  • 15 RPM
  • 1 milhão de TPM
  • 1.500 RPD
Pay-as-you-go:
  • 4.000 RPM
  • 4 milhões de TPM
(em inglês)

Instruções do sistema

Compatível

Modo JSON

Compatível

Esquema JSON

Compatível

Configurações de segurança ajustáveis

Compatível

Armazenamento em cache

Compatível

Ajuste

Compatível

Chamadas de função

Compatível

Execução de código

Compatível

Versões
Leia os padrões de versão do modelo para mais detalhes.
  • Mais recente: gemini-1.5-flash-8b-latest
  • Versão estável mais recente: gemini-1.5-flash-8b
  • Estável:
    • gemini-1.5-flash-8b-001
Atualização mais recente Outubro de 2024

Gemini 1.5 Pro

O Gemini 1.5 Pro é um modelo multimodal de tamanho médio otimizado para uma ampla variedade de tarefas de raciocínio. O 1.5 Pro pode processar grandes quantidades de dados de uma vez, incluindo duas horas de vídeo, 19 horas de áudio, bases de código com 60.000 linhas de código ou 2.000 páginas de texto.

Testar no AI Studio

Detalhes do modelo

Propriedade Descrição
Código do modelo models/gemini-1.5-pro
tipos de dados com suporte

Entradas (link em inglês)

Áudio, imagens, vídeo e texto

Saída

Texto

Limites de token[*]

Limite de tokens de entrada

2.097.152

Limite de token de saída

8.192

Especificações de áudio/visual

Número máximo de imagens por comando

7.200

Duração máxima do vídeo

2 horas

Duração máxima do áudio

Aproximadamente 19 horas

Limites de taxa[**]
Sem custo financeiro
  • 2 RPM
  • 32.000 TPM
  • 50 RPD
Pay-as-you-go::
  • 1.000 RPM
  • 4 milhões de TPM
(em inglês)

Instruções do sistema

Compatível

Modo JSON

Compatível

Esquema JSON

Compatível

Configurações de segurança ajustáveis

Compatível

Armazenamento em cache

Compatível

Ajuste

incompatível

Chamadas de função

Compatível

Execução de código

Compatível

Versões
Leia os padrões de versão do modelo para mais detalhes.
  • Mais recente: gemini-1.5-pro-latest
  • Versão estável mais recente: gemini-1.5-pro
  • Estável:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Atualização mais recente Setembro de 2024

Gemini 1.0 Pro (descontinuado)

O Gemini 1.0 Pro é um modelo de PLN que processa tarefas como chat de código e texto com várias interações e geração de código.

Testar no AI Studio

Detalhes do modelo

Propriedade Descrição
Código do modelo models/gemini-1.0-pro
tipos de dados com suporte

Entrada

Texto

Saída

Texto

Limites de taxa[**]
Sem custo financeiro
  • 15 RPM
  • 32.000 TPM
  • 1.500 RPD
Pay-as-you-go::
  • 360 RPM
  • 120.000 TPM
  • 30.000 RPD
(em inglês)

Instruções do sistema

incompatível

Modo JSON

incompatível

Esquema JSON

incompatível

Configurações de segurança ajustáveis

Compatível

Armazenamento em cache

incompatível

Ajuste

Compatível

Chamadas de função

Compatível

Configuração de chamada de função

incompatível

Execução de código

incompatível

Versões
  • Mais recente: gemini-1.0-pro-latest
  • Versão estável mais recente: gemini-1.0-pro
  • Estável: gemini-1.0-pro-001
Atualização mais recente Fevereiro de 2024

Incorporação de texto e embedding

Incorporação de texto

As incorporações de texto são usadas para medir a relação entre strings e são amplamente utilizadas em muitos aplicativos de IA.

O text-embedding-004 alcança uma performance de recuperação mais forte e supera os modelos atuais com dimensões semelhantes, nos comparativos de referência de incorporação do MTEB padrão.

Detalhes do modelo
Propriedade Descrição
Código do modelo

API Gemini

models/text-embedding-004

tipos de dados com suporte

Entrada

Texto

Saída

Embeddings de textos

Limites de token[*]

Limite de tokens de entrada

2.048

Tamanho da dimensão de saída

768

Limites de taxa[**] 1.500 solicitações por minuto
Configurações de segurança ajustáveis incompatível
Atualização mais recente Abril de 2024

Incorporação

Você pode usar o modelo de embedding para gerar embeddings de texto para textos de entrada.

O modelo de embedding é otimizado para criar embeddings com 768 dimensões para textos de até 2.048 tokens.

Detalhes do modelo de embedding
Propriedade Descrição
Código do modelo models/embedding-001
tipos de dados com suporte

Entrada

Texto

Saída

Embeddings de textos

Limites de token[*]

Limite de tokens de entrada

2.048

Tamanho da dimensão de saída

768

Limites de taxa[**] 1.500 solicitações por minuto
Configurações de segurança ajustáveis incompatível
Atualização mais recente Dezembro de 2023

AQA

É possível usar o modelo AQA para realizar tarefas relacionadas a respostas a perguntas atribuídas (AQA, na sigla em inglês) em um documento, corpus ou conjunto de passagens. O modelo AQA retorna respostas a perguntas com base nas fontes fornecidas, além de estimar a probabilidade de resposta.

Detalhes do modelo

Propriedade Descrição
Código do modelo models/aqa
tipos de dados com suporte

Entrada

Texto

Saída

Texto

Idioma com suporte Inglês
Limites de token[*]

Limite de tokens de entrada

7.168

Limite de token de saída

1.024

Limites de taxa[**] 1.500 solicitações por minuto
Configurações de segurança ajustáveis Compatível
Atualização mais recente Dezembro de 2023

Consulte os exemplos para conhecer os recursos dessas variações de modelo.

[*] Um token equivale a cerca de quatro caracteres para modelos do Gemini. 100 tokens equivalem a cerca de 60 a 80 palavras em inglês.

[**] RPM: solicitações por minuto
TPM: tokens por minuto
RPD: solicitações por dia
TPD: tokens por dia

Devido a limitações de capacidade, os limites máximos de taxa especificados não são garantidos.

Padrões de nome de versão do modelo

Os modelos do Gemini estão disponíveis nas versões de pré-lançamento ou estáveis. No seu código, use um dos formatos de nome de modelo a seguir para especificar qual modelo e versão você quer usar.

  • Mais recente:aponta para a versão mais recente do modelo para uma geração e variação especificadas. O modelo subjacente é atualizado regularmente e pode ser uma versão de pré-lançamento. Apenas apps de teste exploratório e protótipos devem usar esse alias.

    Para especificar a versão mais recente, use o seguinte padrão: <model>-<generation>-<variation>-latest. Por exemplo, gemini-1.0-pro-latest.

  • Versão estável mais recente:aponta para a versão estável mais recente lançada para a geração e a variação do modelo especificado.

    Para especificar a versão estável mais recente, use o seguinte padrão: <model>-<generation>-<variation>. Por exemplo, gemini-1.0-pro.

  • Estável:aponta para um modelo estável específico. Os modelos estáveis não mudam. A maioria dos apps de produção precisa usar um modelo estável específico.

    Para especificar uma versão estável, use o seguinte padrão: <model>-<generation>-<variation>-<version>. Por exemplo, gemini-1.0-pro-001.

  • Experimental:aponta para um modelo experimental disponível na prévia, conforme definido nos Termos, o que significa que ele não é para uso em produção. Lançamos modelos experimentais para coletar feedback, disponibilizar nossas atualizações mais recentes aos desenvolvedores rapidamente e destacar o ritmo de inovação do Google. O que aprendemos com os lançamentos experimentais informa como lançamos os modelos de forma mais ampla. Um modelo experimental pode ser trocado por outro sem aviso prévio. Não garantimos que um modelo experimental se torne um modelo estável no futuro.

    Para especificar uma versão experimental, use o seguinte padrão: <model>-<generation>-<variation>-<version>. Por exemplo, gemini-exp-1121.

Idiomas disponíveis

Os modelos do Gemini são treinados para funcionar com os seguintes idiomas:

  • Árabe (ar)
  • Bengalês (bn)
  • Búlgaro (bg)
  • Chinês (simplificado e tradicional) (zh)
  • Croata (hr)
  • República Tcheca (cs)
  • Coreano (da)
  • Holandês (nl)
  • Inglês (en)
  • Estoniano (et)
  • Finlandês (fi)
  • Francês (fr)
  • Alemão (de)
  • Grego (el)
  • Hebraico (iw)
  • Hindi (hi)
  • Húngaro (hu)
  • Indonésio (id)
  • Italiano (it)
  • Japonês (ja)
  • Coreano (ko)
  • Letão (lv)
  • Lituano (lt)
  • Norueguês (no)
  • Polonês (pl)
  • Português (pt)
  • Romeno (ro)
  • Russo (ru)
  • Sérvio (sr)
  • Eslovaco (sk)
  • Esloveno (sl)
  • Espanhol (es)
  • Suaíli (sw)
  • Sueco (sv)
  • Tailandês (th)
  • Turco (tr)
  • Ucraniano (uk)
  • Vietnamita (vi)