O PaLM 2 é uma família de modelos de linguagem otimizados para facilidade de uso nos principais casos de uso de desenvolvedores. A família de modelos PaLM inclui variações treinadas para geração de texto e chat, bem como incorporações de texto. Este guia fornece informações sobre cada variação para ajudar você a decidir qual é a melhor para seu caso de uso.
Tamanhos de modelos
Os tamanhos dos modelos são descritos por um nome de animal. A tabela a seguir mostra os tamanhos disponíveis e o que eles significam em relação um ao outro.
Tamanho do modelo | Descrição | Serviços |
---|---|---|
Bisão | O tamanho do modelo PaLM 2 mais compatível. |
|
Lagartixa | O menor e mais eficiente tamanho do modelo PaLM 2. |
|
Variações de modelo
Diferentes modelos PaLM estão disponíveis e otimizados para casos de uso específicos. A tabela a seguir descreve os atributos de cada um.
Variedade | Atributo | Descrição |
---|---|---|
Bison Text (link em inglês) | Última atualização do modelo | Maio de 2023 |
Código do modelo | text-bison-001 |
|
Recursos do modelo |
|
|
Segurança de modelos | Configurações de segurança ajustáveis para seis dimensões de danos disponíveis para desenvolvedores. Consulte o tópico Configurações de segurança para mais detalhes. | |
Limite de taxa | 90 solicitações por minuto | |
Bison Chat (em inglês) | Última atualização do modelo | Maio de 2023 |
Código do modelo | chat-bison-001 |
|
Recursos do modelo |
|
|
Segurança de modelos | Não há configurações de segurança ajustáveis. | |
Limite de taxa | 90 solicitações por minuto | |
Gecko Embedding | Última atualização do modelo | Maio de 2023 |
Código do modelo | embedding-gecko-001 |
|
Recursos do modelo |
|
|
Segurança de modelos | Não há configurações de segurança ajustáveis. | |
Limite de taxa | 1.500 solicitações por minuto |
Metadados do modelo
Use a API ModelService
para receber mais metadados sobre os
modelos mais recentes, como limites de tokens de entrada e saída. A tabela a seguir
exibe os metadados da variante de modelo text-bison-001
.
Atributo | Valor |
---|---|
Nome de exibição | Bisonte de texto |
Código do modelo | models/text-bison-001 |
Descrição | Modelo segmentado para geração de texto |
Limite de tokens de entrada | 8196 |
Limite de tokens de saída | 1024 |
Métodos de geração compatíveis | generateText |
Temperatura | 0.7 |
top_p | 0,95 |
top_k | 40 |
Atributos do modelo
A tabela abaixo descreve os atributos do PaLM 2 que são comuns a todas as variações do modelo.
Atributo | Descrição |
---|---|
Dados de treinamento | O limite de conhecimento do PaLM 2 é meados de 2021. O conhecimento sobre eventos após esse período é limitado. |
Idioma suportado | Inglês |
Parâmetros de modelo configuráveis |
|
Consulte a seção Parâmetros do modelo do guia de Introdução aos LLMs para ver informações sobre cada um desses parâmetros.