Modelos do Yahoo!

Gemini é uma família de modelos de IA generativa que permite aos desenvolvedores gerar conteúdo e resolver problemas. Esses modelos são projetados e treinados para lidar com texto e imagens como entrada. Neste guia, fornecemos informações sobre cada variante de modelo para ajudar você a decidir qual é a melhor opção para seu caso de uso.

Veja um breve resumo dos modelos disponíveis e de seus recursos:

Modelos Entrada Saída
Gêmeos
  • Gemini 1.5 Pro (somente pré-lançamento)
Texto e imagens Texto
  • Gemini 1.0 Pro
Texto Texto
  • Gemini 1.0 Pro Vision
Texto e imagens Texto
Embeddings
  • Incorporação
Texto Embeddings de textos
Recuperação
  • AQA
Texto Texto

Segurança e uso pretendido

Os modelos generativos de inteligência artificial são ferramentas poderosas, mas não estão sem as limitações. Sua versatilidade e aplicabilidade às vezes pode levar a resultados inesperados, como saídas imprecisas, tendenciosas ou ofensivas. O pós-processamento e a avaliação manual rigorosa são essenciais para limitar o risco de danos desses resultados. Consulte as orientações de segurança para ver outras sugestões de uso seguro.

Os modelos fornecidos pela API Gemini podem ser usados para uma ampla variedade de aplicativos de IA generativa e de processamento de linguagem natural (PLN). O uso dessas funções só está disponível por meio da API Gemini ou do app da Web Google Studio. O uso da API Gemini também está sujeito à Política de uso proibido da IA generativa e aos Termos de Serviço da API Genmini.

Tamanhos de modelos

A tabela a seguir mostra os tamanhos disponíveis e o que eles significam entre si.

Tamanho do modelo Descrição Serviços
Gemini 1.0 Pro Um tamanho de modelo que equilibra capacidade e eficiência.
  • texto
  • chat

Versões do modelo

Gemini estão disponíveis nas versões pré-lançamento ou estável. No seu código, use um dos formatos de nome de modelo a seguir para especificar qual modelo e versão você quer usar.

  • Mais recente:aponta para a versão mais moderna do modelo para uma geração e variação especificadas. O modelo subjacente é atualizado regularmente e pode ser uma versão de pré-lançamento. Somente apps e protótipos de teste exploratório precisam usar esse alias.

    Para especificar a versão mais recente, use o seguinte padrão: <model>-<generation>-<variation>-latest. Por exemplo, gemini-1.0-pro-latest.

  • Stable mais recente:indica a versão estável mais recente lançada para a geração e variação de modelo especificadas.

    Para especificar a versão estável mais recente, use o seguinte padrão: <model>-<generation>-<variation>. Por exemplo, gemini-1.0-pro.

  • Stable:aponta para um modelo estável específico. Os modelos estáveis não mudam. A maioria dos apps de produção precisa usar um modelo estável específico.

    Para especificar uma versão estável, use o seguinte padrão: <model>-<generation>-<variation>-<version>. Por exemplo, gemini-1.0-pro-001.

Para modelos que têm uma versão estável, consulte a linha "Nomes de modelo" do modelo em Variações de modelo.

Variações de modelo

A API Gemini oferece diferentes modelos otimizados para casos de uso específicos. A tabela a seguir descreve os atributos de cada um.

Variedade Atributo Descrição
Gemini 1.5 Pro (somente pré-lançamento) Última atualização do modelo Abril de 2024
Código do modelo models/gemini-1.5-pro-latest
Capacidades do modelo
  • Entrada: áudio, imagem, texto
  • Saída: texto
  • Otimizado para tarefas de linguagem, como:
    • Geração de códigos
    • Geração de texto
    • Edição de texto
    • Solução de problemas
    • Geração de recomendações
    • Extração de informações
    • Extração ou geração de dados
    • agente de IA
  • Pode processar tarefas zero, one e few-shot.
Métodos de geração com suporte generateContent
Limite de tokens de entrada 1048576
Limite de token de saída 8192
Segurança de modelos Configurações de segurança aplicadas automaticamente que podem ser ajustadas pelos desenvolvedores. Consulte o tópico configurações de segurança para mais detalhes.
Limite de taxa 2 consultas por minuto, 1.000 consultas por dia [1]
Gemini Pro Última atualização do modelo fevereiro de 2024
Código do modelo models/gemini-pro
Capacidades do modelo
  • Entrada: texto
  • Saída: texto
  • Gera texto.
  • Pode lidar com formato de conversa de vários turnos.
  • Pode processar tarefas zero, one e few-shot.
Métodos de geração com suporte generateContent
Limite de tokens de entrada 30.720
Limite de token de saída 2048
Segurança de modelos Configurações de segurança aplicadas automaticamente que podem ser ajustadas pelos desenvolvedores. Consulte o tópico configurações de segurança para mais detalhes.
Limite de taxa 60 solicitações por minuto [1]
Nomes de modelos
  • Versão mais recente:gemini-1.0-pro-latest
  • Versão estável mais recente:gemini-1.0-pro
  • Versões estáveis:
    • gemini-1.0-pro-001
Gemini 1.0 Pro Vision Última atualização do modelo Dezembro de 2023
Código do modelo models/gemini-pro-vision
Capacidades do modelo
  • Entrada: texto e imagens
  • Saída: texto
  • Pode receber entradas multimodais, texto e imagem.
  • Pode processar tarefas zero, one e few-shot.
Métodos de geração com suporte generateContent
Limite de tokens de entrada 12.288
Limite de token de saída 4096
Segurança de modelos Configurações de segurança aplicadas automaticamente que podem ser ajustadas pelos desenvolvedores. Consulte o tópico configurações de segurança para mais detalhes.
Limite de taxa 60 solicitações por minuto [1]
Incorporação Última atualização do modelo Dezembro de 2023
Código do modelo models/embedding-001
Capacidades do modelo
  • Entrada: texto
  • Saída: texto
  • Gera embeddings de texto para o texto de entrada.
  • Otimizada para criar embeddings para texto de até 2.048 tokens.
Métodos de geração com suporte embedContent
Segurança de modelos Não há configurações de segurança ajustáveis.
Limite de taxa 1.500 solicitações por minuto [1]
Incorporação de texto Última atualização do modelo Abril de 2024
Código do modelo models/text-embedding-004 (text-embedding-preview-0409 na Vertex AI)
Capacidades do modelo
  • Entrada: texto
  • Saída: texto
  • Gera embeddings de texto para o texto de entrada.
  • Oferece suporte a tamanhos de embedding elástico menores que 768.
Métodos de geração com suporte embedContent
Segurança de modelos Não há configurações de segurança ajustáveis.
Limite de taxa 1.500 solicitações por minuto [1]
AQA Última atualização do modelo Dezembro de 2023
Código do modelo models/aqa
Capacidades do modelo
  • Entrada: texto
  • Saída: texto
  • Modelo que executa respostas a perguntas atribuídas.
  • Modelo treinado para retornar respostas a perguntas fundamentadas nas fontes fornecidas, além de estimar a probabilidade de resposta.
Métodos de geração com suporte generateAnswer
Idiomas disponíveis Inglês
Limite de tokens de entrada 7168
Limite de token de saída 1024
Segurança de modelos Configurações de segurança aplicadas automaticamente que podem ser ajustadas pelos desenvolvedores. Consulte o tópico configurações de segurança para mais detalhes.
Limite de taxa 60 solicitações por minuto [1]

Consulte os exemplos para explorar os recursos dessas variações de modelo.

Metadados do modelo

Use a API ModelService para receber mais metadados sobre os modelos mais recentes, como limites de tokens de entrada e saída. A tabela a seguir exibe os metadados da variante de modelo Gemini Pro.

Atributo Valor
Nome de exibição Gemini 1.0 Pro
Código do modelo models/gemini-1.0-pro
Descrição Modelo segmentado para geração de texto
Métodos de geração com suporte generateContent
Temperatura 0,9
top_p 1
top_k 1

Atributos do modelo

A tabela a seguir descreve os atributos dos modelos Gemini que são comuns a todas as variações de modelo.

Atributo Descrição
Dados de treinamento O limite de conhecimento para o Gemini é o início de 2023. O conhecimento sobre eventos após esse período é limitado.
Idiomas disponíveis Consulte os idiomas disponíveis
Parâmetros de modelo configuráveis
  • Top-p
  • Top-K
  • Temperatura
  • Sequência de paradas
  • Comprimento máximo da saída
  • Número de candidatos para a resposta

[1] Devido a limitações de capacidade, os limites máximos de taxa especificados não são garantidos.

Consulte a seção de parâmetros do modelo do guia de introdução aos LLMs para informações sobre cada um desses parâmetros.

Próximas etapas