- Solicitação HTTP
- Parâmetros de caminho
- Corpo da solicitação
- Corpo da resposta
- Escopos de autorização
Gera uma resposta do modelo com base em uma mensagem de entrada.
Solicitação HTTP
POST https://generativelanguage.googleapis.com/v1beta/{model=tunedModels/*}:generateText
O URL usa a sintaxe de transcodificação gRPC.
Parâmetros de caminho
Parâmetros | |
---|---|
model |
Obrigatório. O nome do |
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
Representação JSON |
---|
{ "prompt": { object ( |
Campos | |
---|---|
prompt |
Obrigatório. O texto de entrada de formato livre fornecido ao modelo como um comando. Com um comando, o modelo gera uma resposta de TextConclusão que prevê a conclusão do texto de entrada. |
safetySettings[] |
Opcional. Uma lista de instâncias de que será aplicado em |
stopSequences[] |
O conjunto de sequências de caracteres (até 5) que interromperão a geração de saída. Se especificado, a API será interrompida na primeira ocorrência de uma sequência de parada. A sequência de parada não será incluída como parte da resposta. |
temperature |
Opcional. Controla a aleatoriedade da saída. Observação: o valor padrão varia de acordo com o modelo. Consulte o atributo Os valores podem variar de [0.0,1.0]. Um valor próximo de 1,0 produz respostas mais variadas e criativas, enquanto um valor próximo de 0,0 normalmente resulta em respostas mais diretas do modelo. |
candidateCount |
Opcional. Número de respostas geradas para retornar. Esse valor precisa estar entre [1, 8]. Se não for definido, o padrão será 1. |
maxOutputTokens |
Opcional. O número máximo de tokens a serem incluídos em um candidato. Se não for definido, o padrão será outputTokenLimit definido na especificação |
topP |
Opcional. A probabilidade cumulativa máxima de tokens a serem considerados na amostragem. O modelo usa amostragem combinada de Top-k e de núcleos. Os tokens são classificados com base nas probabilidades atribuídas, de modo que somente aqueles mais prováveis são considerados. A amostragem top-k limita diretamente o número máximo de tokens a serem considerados, enquanto a amostragem Nucleus limita o número de tokens com base na probabilidade cumulativa. Observação: o valor padrão varia de acordo com o modelo. Consulte o atributo |
topK |
Opcional. O número máximo de tokens a serem considerados durante a amostragem. O modelo usa amostragem combinada de Top-k e de núcleos. A amostragem top-k considera o conjunto de Observação: o valor padrão varia de acordo com o modelo. Consulte o atributo |
Corpo da resposta
Se a solicitação for bem-sucedida, o corpo da resposta conterá uma instância de GenerateTextResponse
.
Escopos de autorização
Requer um dos seguintes escopos de OAuth:
https://www.googleapis.com/auth/generative-language
https://www.googleapis.com/auth/generative-language.tuning
https://www.googleapis.com/auth/generative-language.tuning.readonly
https://www.googleapis.com/auth/generative-language.retriever
https://www.googleapis.com/auth/generative-language.retriever.readonly
Para saber mais, consulte a Visão geral da autenticação.