O PaLM 2 é uma família de modelos de linguagem otimizados para facilidade de uso nos principais casos de uso de desenvolvedores. A família de modelos PaLM inclui variações treinadas para geração de texto e chat, bem como incorporações de texto. Este guia fornece informações sobre cada variação para ajudar você a decidir qual é a melhor para seu caso de uso.
Tamanhos de modelos
Os tamanhos dos modelos são descritos por um nome de animal. A tabela a seguir mostra os tamanhos disponíveis e o que eles significam em relação um ao outro.
| Tamanho do modelo | Descrição | Serviços |
|---|---|---|
| Bisão | O tamanho do modelo PaLM 2 mais compatível. |
|
| Lagartixa | O menor e mais eficiente tamanho do modelo PaLM 2. |
|
Variações de modelo
Diferentes modelos PaLM estão disponíveis e otimizados para casos de uso específicos. A tabela a seguir descreve os atributos de cada um.
| Variedade | Atributo | Descrição |
|---|---|---|
| Bison Text (link em inglês) | Última atualização do modelo | Maio de 2023 |
| Código do modelo | text-bison-001 |
|
| Recursos do modelo |
|
|
| Segurança de modelos | Configurações de segurança ajustáveis para seis dimensões de danos disponíveis para desenvolvedores. Consulte o tópico Configurações de segurança para mais detalhes. | |
| Limite de taxa | 90 solicitações por minuto | |
| Bison Chat (em inglês) | Última atualização do modelo | Maio de 2023 |
| Código do modelo | chat-bison-001 |
|
| Recursos do modelo |
|
|
| Segurança de modelos | Não há configurações de segurança ajustáveis. | |
| Limite de taxa | 90 solicitações por minuto | |
| Gecko Embedding | Última atualização do modelo | Maio de 2023 |
| Código do modelo | embedding-gecko-001 |
|
| Recursos do modelo |
|
|
| Segurança de modelos | Não há configurações de segurança ajustáveis. | |
| Limite de taxa | 1.500 solicitações por minuto | |
Metadados do modelo
Use a API ModelService para receber mais metadados sobre os
modelos mais recentes, como limites de tokens de entrada e saída. A tabela a seguir
exibe os metadados da variante de modelo text-bison-001.
| Atributo | Valor |
|---|---|
| Nome de exibição | Bisonte de texto |
| Código do modelo | models/text-bison-001 |
| Descrição | Modelo segmentado para geração de texto |
| Limite de tokens de entrada | 8196 |
| Limite de tokens de saída | 1024 |
| Métodos de geração compatíveis | generateText |
| Temperatura | 0.7 |
| top_p | 0,95 |
| top_k | 40 |
Atributos do modelo
A tabela abaixo descreve os atributos do PaLM 2 que são comuns a todas as variações do modelo.
| Atributo | Descrição |
|---|---|
| Dados de treinamento | O limite de conhecimento do PaLM 2 é meados de 2021. O conhecimento sobre eventos após esse período é limitado. |
| Idioma suportado | Inglês |
| Parâmetros de modelo configuráveis |
|
Consulte a seção Parâmetros do modelo do guia de Introdução aos LLMs para ver informações sobre cada um desses parâmetros.