Método: models.generateText
Gera uma resposta do modelo com base em uma mensagem de entrada.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:generateText
O URL usa a sintaxe de transcodificação gRPC.
Parâmetros de caminho
model
string
Obrigatório. O nome do Model
ou TunedModel
a ser usado para gerar a conclusão. Exemplos: models/text-bison-001 tunedModels/sentence-translator-u3b7m Ele tem o formato models/{model}
.
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
prompt
object (TextPrompt
)
Obrigatório. O texto de entrada em formato livre fornecido ao modelo como um comando.
Dado um comando, o modelo vai gerar uma resposta de TextCompletion que ele prevê como a conclusão do texto de entrada.
safetySettings[]
object (SafetySetting
)
Opcional. Uma lista de instâncias SafetySetting
exclusivas para bloquear conteúdo não seguro.
que será aplicado no GenerateTextRequest.prompt
e GenerateTextResponse.candidates
. Não pode haver mais de uma configuração para cada tipo de SafetyCategory
. A API vai bloquear todas as solicitações e respostas que não atenderem aos limites definidos por essas configurações. Essa lista substitui as configurações padrão de cada SafetyCategory
especificado nas safetySettings. Se não houver SafetySetting
para um determinado SafetyCategory
fornecido na lista, a API vai usar a configuração de segurança padrão para essa categoria. As categorias de dano HARM_CATEGORY_DEROGATORY, HARM_CATEGORY_TOXICITY, HARM_CATEGORY_VIOLENCE, HARM_CATEGORY_SEXUAL, HARM_CATEGORY_MEDICAL e HARM_CATEGORY_DANGEROUS são compatíveis com o serviço de texto.
stopSequences[]
string
O conjunto de sequências de caracteres (até 5) que vai interromper a geração de saída. Se especificado, a API vai parar na primeira aparição de uma sequência de parada. A sequência de paradas não será incluída como parte da resposta.
temperature
number
Opcional. Controla a aleatoriedade da saída. Observação: o valor padrão varia de acordo com o modelo. Consulte o atributo Model.temperature
do Model
que retornou a função getModel
.
Os valores podem variar de [0,0,1,0]. Um valor mais próximo de 1,0 vai produzir respostas mais variadas e criativas, enquanto um valor mais próximo de 0,0 geralmente resulta em respostas mais diretas do modelo.
candidateCount
integer
Opcional. Número de respostas geradas a serem retornadas.
Esse valor precisa estar entre [1, 8], inclusive. Se não for definido, o padrão será 1.
maxOutputTokens
integer
Opcional. O número máximo de tokens a serem incluídos em um candidato.
Se não for definido, o padrão será outputTokenLimit especificado na especificação Model
.
topP
number
Opcional. A probabilidade cumulativa máxima de tokens a serem considerados na amostragem.
O modelo usa a amostragem top-k e de núcleo combinada.
Os tokens são classificados com base nas probabilidades atribuídas, de modo que apenas os mais prováveis são considerados. A amostragem top-k limita diretamente o número máximo de tokens a serem considerados, enquanto a amostragem de núcleo limita o número de tokens com base na probabilidade cumulativa.
Observação: o valor padrão varia de acordo com o modelo. Consulte o atributo Model.top_p
do Model
que retornou a função getModel
.
topK
integer
Opcional. O número máximo de tokens a considerar na amostragem.
O modelo usa a amostragem top-k e de núcleo combinada.
A amostragem Top-k considera o conjunto de topK
tokens mais prováveis. O padrão é 40.
Observação: o valor padrão varia de acordo com o modelo. Consulte o atributo Model.top_k
do Model
que retornou a função getModel
.
Corpo da resposta
Se a solicitação for bem-sucedida, o corpo da resposta conterá uma instância de GenerateTextResponse
.
Método: models.countTextTokens
Executa o tokenizer de um modelo em um texto e retorna a contagem de tokens.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:countTextTokens
O URL usa a sintaxe de transcodificação gRPC.
Parâmetros de caminho
model
string
Obrigatório. O nome do recurso do modelo. Ele serve como um ID para o modelo usar.
Esse nome precisa corresponder a um nome de modelo retornado pelo método models.list
.
Formato: models/{model}
Ele tem o formato models/{model}
.
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
prompt
object (TextPrompt
)
Obrigatório. O texto de entrada em formato livre fornecido ao modelo como um comando.
Corpo da resposta
Uma resposta de models.countTextTokens
.
Ele retorna a tokenCount
do modelo para o prompt
.
Se bem-sucedido, o corpo da resposta incluirá dados com a estrutura a seguir:
tokenCount
integer
O número de tokens em que o model
tokeniza o prompt
.
Sempre não negativa.
Representação JSON |
---|
{ "tokenCount": integer } |
Método: models.generateMessage
Gera uma resposta do modelo com base em uma entrada MessagePrompt
.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:generateMessage
O URL usa a sintaxe de transcodificação gRPC.
Parâmetros de caminho
model
string
Obrigatório. O nome do modelo a ser usado.
Formato: name=models/{model}
. Ele tem o formato models/{model}
.
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
prompt
object (MessagePrompt
)
Obrigatório. A entrada textual estruturada fornecida ao modelo como um comando.
Com base em uma instrução, o modelo vai retornar o que ele prevê ser a próxima mensagem na discussão.
temperature
number
Opcional. Controla a aleatoriedade da saída.
Os valores podem variar até [0.0,1.0]
. Um valor mais próximo de 1.0
vai produzir respostas mais variadas, enquanto um valor mais próximo de 0.0
normalmente resulta em respostas menos surpreendentes do modelo.
candidateCount
integer
Opcional. O número de mensagens de resposta geradas a serem retornadas.
Esse valor precisa estar entre [1, 8]
. Se não for definido, o padrão será 1
.
topP
number
Opcional. A probabilidade cumulativa máxima de tokens a serem considerados na amostragem.
O modelo usa a amostragem top-k e de núcleo combinada.
A amostragem de núcleo considera o menor conjunto de tokens com uma soma de probabilidade de pelo menos topP
.
topK
integer
Opcional. O número máximo de tokens a considerar na amostragem.
O modelo usa a amostragem top-k e de núcleo combinada.
A amostragem Top-k considera o conjunto de topK
tokens mais prováveis.
Corpo da resposta
A resposta do modelo.
Isso inclui mensagens candidatas e o histórico de conversas na forma de mensagens ordenadas cronologicamente.
Se bem-sucedido, o corpo da resposta incluirá dados com a estrutura a seguir:
candidates[]
object (Message
)
Mensagens de resposta candidatas do modelo.
messages[]
object (Message
)
O histórico de conversas usado pelo modelo.
filters[]
object (ContentFilter
)
Um conjunto de metadados de filtragem de conteúdo para o comando e o texto de resposta.
Isso indica quais SafetyCategory
s bloquearam um candidato dessa resposta, o HarmProbability
mais baixo que acionou um bloqueio e a configuração de HarmThreshold para essa categoria.
Representação JSON |
---|
{ "candidates": [ { object ( |
Método: models.countMessageTokens
Executa o tokenizer de um modelo em uma string e retorna a contagem de tokens.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:countMessageTokens
O URL usa a sintaxe de transcodificação gRPC.
Parâmetros de caminho
model
string
Obrigatório. O nome do recurso do modelo. Ele serve como um ID para o modelo usar.
Esse nome precisa corresponder a um nome de modelo retornado pelo método models.list
.
Formato: models/{model}
Ele tem o formato models/{model}
.
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
prompt
object (MessagePrompt
)
Obrigatório. O comando, cuja contagem de tokens será retornada.
Corpo da resposta
Uma resposta de models.countMessageTokens
.
Ele retorna a tokenCount
do modelo para o prompt
.
Se bem-sucedido, o corpo da resposta incluirá dados com a estrutura a seguir:
tokenCount
integer
O número de tokens em que o model
tokeniza o prompt
.
Sempre não negativa.
Representação JSON |
---|
{ "tokenCount": integer } |
Método: models.embedText
Gera uma embedding do modelo com base em uma mensagem de entrada.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:embedText
O URL usa a sintaxe de transcodificação gRPC.
Parâmetros de caminho
model
string
Obrigatório. O nome do modelo a ser usado com o formato model=models/{model}. Ele tem o formato models/{model}
.
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
text
string
Opcional. O texto de entrada em formato livre que o modelo vai transformar em um embedding.
Método: models.batchEmbedText
- Endpoint
- Parâmetros de caminho
- Corpo da solicitação
- Corpo da resposta
- Escopos de autorização
- EmbedTextRequest
Gera várias embeddings do modelo com base no texto de entrada em uma chamada síncrona.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:batchEmbedText
O URL usa a sintaxe de transcodificação gRPC.
Parâmetros de caminho
model
string
Obrigatório. O nome do Model
a ser usado para gerar o embedding. Exemplos: models/embedding-gecko-001. Ele tem o formato models/{model}
.
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
texts[]
string
Opcional. Os textos de entrada de formato livre que o modelo vai transformar em um embedding. O limite atual é de 100 textos, acima do qual um erro será gerado.
requests[]
object (EmbedTextRequest
)
Opcional. Insira solicitações para o lote. Apenas uma das opções texts
ou requests
pode ser definida.
Corpo da resposta
A resposta a uma EmbedTextRequest.
Se bem-sucedido, o corpo da resposta incluirá dados com a estrutura a seguir:
embeddings[]
object (Embedding
)
Apenas saída. Os embeddings gerados a partir do texto de entrada.
Representação JSON |
---|
{
"embeddings": [
{
object ( |
EmbedTextRequest
Solicitação para receber uma embedding de texto do modelo.
model
string
Obrigatório. O nome do modelo a ser usado com o formato model=models/{model}.
text
string
Opcional. O texto de entrada em formato livre que o modelo vai transformar em um embedding.
Representação JSON |
---|
{ "model": string, "text": string } |
Método: tunedModels.generateText
Gera uma resposta do modelo com base em uma mensagem de entrada.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=tunedModels /*}:generateText
O URL usa a sintaxe de transcodificação gRPC.
Parâmetros de caminho
model
string
Obrigatório. O nome do Model
ou TunedModel
a ser usado para gerar a conclusão. Exemplos: models/text-bison-001 tunedModels/sentence-translator-u3b7m Ele tem o formato tunedModels/{tunedmodel}
.
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
prompt
object (TextPrompt
)
Obrigatório. O texto de entrada em formato livre fornecido ao modelo como um comando.
Dado um comando, o modelo vai gerar uma resposta de TextCompletion que ele prevê como a conclusão do texto de entrada.
safetySettings[]
object (SafetySetting
)
Opcional. Uma lista de instâncias SafetySetting
exclusivas para bloquear conteúdo não seguro.
que será aplicado no GenerateTextRequest.prompt
e GenerateTextResponse.candidates
. Não pode haver mais de uma configuração para cada tipo de SafetyCategory
. A API vai bloquear todas as solicitações e respostas que não atenderem aos limites definidos por essas configurações. Essa lista substitui as configurações padrão de cada SafetyCategory
especificado nas safetySettings. Se não houver SafetySetting
para um determinado SafetyCategory
fornecido na lista, a API vai usar a configuração de segurança padrão para essa categoria. As categorias de dano HARM_CATEGORY_DEROGATORY, HARM_CATEGORY_TOXICITY, HARM_CATEGORY_VIOLENCE, HARM_CATEGORY_SEXUAL, HARM_CATEGORY_MEDICAL e HARM_CATEGORY_DANGEROUS são compatíveis com o serviço de texto.
stopSequences[]
string
O conjunto de sequências de caracteres (até 5) que vai interromper a geração de saída. Se especificado, a API vai parar na primeira aparição de uma sequência de parada. A sequência de paradas não será incluída como parte da resposta.
temperature
number
Opcional. Controla a aleatoriedade da saída. Observação: o valor padrão varia de acordo com o modelo. Consulte o atributo Model.temperature
do Model
que retornou a função getModel
.
Os valores podem variar de [0,0,1,0]. Um valor mais próximo de 1,0 vai produzir respostas mais variadas e criativas, enquanto um valor mais próximo de 0,0 geralmente resulta em respostas mais diretas do modelo.
candidateCount
integer
Opcional. Número de respostas geradas a serem retornadas.
Esse valor precisa estar entre [1, 8], inclusive. Se não for definido, o padrão será 1.
maxOutputTokens
integer
Opcional. O número máximo de tokens a serem incluídos em um candidato.
Se não for definido, o padrão será outputTokenLimit especificado na especificação Model
.
topP
number
Opcional. A probabilidade cumulativa máxima de tokens a serem considerados na amostragem.
O modelo usa a amostragem top-k e de núcleo combinada.
Os tokens são classificados com base nas probabilidades atribuídas, de modo que apenas os mais prováveis são considerados. A amostragem top-k limita diretamente o número máximo de tokens a serem considerados, enquanto a amostragem de núcleo limita o número de tokens com base na probabilidade cumulativa.
Observação: o valor padrão varia de acordo com o modelo. Consulte o atributo Model.top_p
do Model
que retornou a função getModel
.
topK
integer
Opcional. O número máximo de tokens a considerar na amostragem.
O modelo usa a amostragem top-k e de núcleo combinada.
A amostragem Top-k considera o conjunto de topK
tokens mais prováveis. O padrão é 40.
Observação: o valor padrão varia de acordo com o modelo. Consulte o atributo Model.top_k
do Model
que retornou a função getModel
.
Corpo da resposta
Se a solicitação for bem-sucedida, o corpo da resposta conterá uma instância de GenerateTextResponse
.
ContentFilter
Metadados de filtragem de conteúdo associados ao processamento de uma única solicitação.
O ContentFilter contém um motivo e uma string de suporte opcional. O motivo pode não ser especificado.
reason
enum (BlockedReason
)
O motivo pelo qual o conteúdo foi bloqueado durante o processamento da solicitação.
message
string
Uma string que descreve o comportamento de filtragem com mais detalhes.
Representação JSON |
---|
{
"reason": enum ( |
BlockedReason
Uma lista de motivos pelos quais o conteúdo pode ter sido bloqueado.
Enums | |
---|---|
BLOCKED_REASON_UNSPECIFIED |
O motivo do bloqueio não foi especificado. |
SAFETY |
O conteúdo foi bloqueado pelas configurações de segurança. |
OTHER |
O conteúdo foi bloqueado, mas o motivo não foi categorizado. |
Incorporação
Uma lista de pontos flutuantes que representam a incorporação.
value[]
number
Os valores de embedding.
Representação JSON |
---|
{ "value": [ number ] } |
Mensagem
A unidade base do texto estruturado.
Um Message
inclui um author
e o content
do Message
.
O author
é usado para marcar mensagens quando elas são inseridas no modelo como texto.
content
string
Obrigatório. O conteúdo de texto da Message
estruturada.
citationMetadata
object (CitationMetadata
)
Apenas saída. Informações de citação para content
gerado por modelo neste Message
.
Se esse Message
foi gerado como saída do modelo, esse campo pode ser preenchido com informações de atribuição para qualquer texto incluído no content
. Este campo é usado apenas na saída.
Representação JSON |
---|
{
"author": string,
"content": string,
"citationMetadata": {
object ( |
MessagePrompt
Todo o texto de entrada estruturado transmitido ao modelo como um comando.
Um MessagePrompt
contém um conjunto estruturado de campos que fornecem contexto para a conversa, exemplos de pares de mensagens de entrada do usuário/saída do modelo que preparam o modelo para responder de maneiras diferentes e o histórico de conversas ou a lista de mensagens que representam os turnos alternados da conversa entre o usuário e o modelo.
context
string
Opcional. Texto que deve ser fornecido ao modelo primeiro para fundamentar a resposta.
Se não estiver vazio, esse context
será fornecido ao modelo antes de examples
e messages
. Ao usar um context
, forneça-o a cada solicitação para manter a continuidade.
Esse campo pode ser uma descrição do comando para o modelo, ajudando a fornecer contexto e orientar as respostas. Exemplos: "Traduzir a frase do inglês para o francês" ou "Dada uma declaração, classifique o sentimento como feliz, triste ou neutro".
Qualquer coisa incluída nesse campo terá precedência sobre o histórico de mensagens se o tamanho total da entrada exceder o inputTokenLimit
do modelo e a solicitação de entrada for truncada.
examples[]
object (Example
)
Opcional. Exemplos do que o modelo deve gerar.
Isso inclui a entrada do usuário e a resposta que o modelo deve emular.
Esses examples
são tratados de maneira idêntica às mensagens de conversa, exceto pelo fato de terem precedência sobre o histórico em messages
: se o tamanho total da entrada exceder o inputTokenLimit
do modelo, a entrada será truncada. Os itens serão removidos de messages
antes de examples
.
messages[]
object (Message
)
Obrigatório. Um resumo do histórico de conversas recentes, classificado cronologicamente.
Alternar entre dois autores.
Se o tamanho total da entrada exceder o inputTokenLimit
do modelo, a entrada será truncada: os itens mais antigos serão descartados da messages
.
Exemplo
Um exemplo de entrada/saída usado para instruir o modelo.
Ele demonstra como o modelo deve responder ou formatar a resposta.
input
object (Message
)
Obrigatório. Exemplo de uma entrada Message
do usuário.
output
object (Message
)
Obrigatório. Um exemplo do que o modelo deve gerar com base na entrada.
GenerateTextResponse
A resposta do modelo, incluindo as finalizações de candidato.
candidates[]
object (TextCompletion
)
Respostas candidatas do modelo.
filters[]
object (ContentFilter
)
Um conjunto de metadados de filtragem de conteúdo para o comando e o texto de resposta.
Isso indica quais SafetyCategory
s bloquearam um candidato dessa resposta, o HarmProbability
mais baixo que acionou um bloqueio e a configuração de HarmThreshold para essa categoria. Isso indica a menor mudança no SafetySettings
que seria necessária para desbloquear pelo menos uma resposta.
O bloqueio é configurado pelo SafetySettings
na solicitação (ou pelo SafetySettings
padrão da API).
safetyFeedback[]
object (SafetyFeedback
)
Retorna qualquer feedback de segurança relacionado à filtragem de conteúdo.
Representação JSON |
---|
{ "candidates": [ { object ( |
TextCompletion
Texto de saída retornado de um modelo.
output
string
Apenas saída. O texto gerado retornado pelo modelo.
safetyRatings[]
object (SafetyRating
)
Classificações de segurança de uma resposta.
Há no máximo uma classificação por categoria.
citationMetadata
object (CitationMetadata
)
Apenas saída. Informações de citação para output
gerado por modelo neste TextCompletion
.
Esse campo pode ser preenchido com informações de atribuição para qualquer texto incluído no output
.
Representação JSON |
---|
{ "output": string, "safetyRatings": [ { object ( |
SafetyFeedback
Feedback de segurança para uma solicitação inteira.
Esse campo é preenchido se o conteúdo da entrada e/ou da resposta for bloqueado devido a configurações de segurança. O SafetyFeedback pode não existir para todas as categorias de dano. Cada SafetyFeedback retorna as configurações de segurança usadas pela solicitação, bem como a HarmProbability mais baixa que pode ser permitida para retornar um resultado.
rating
object (SafetyRating
)
Classificação de segurança avaliada pelo conteúdo.
setting
object (SafetySetting
)
Configurações de segurança aplicadas à solicitação.
Representação JSON |
---|
{ "rating": { object ( |