- Requête HTTP
- Paramètres de chemin d'accès
- Corps de la requête
- Corps de la réponse
- Champs d'application des autorisations
Génère une réponse du modèle à partir d'un message d'entrée.
Requête HTTP
POST https://generativelanguage.googleapis.com/v1beta/{model=tunedModels/*}:generateText
L'URL utilise la syntaxe de transcodage gRPC.
Paramètres de chemin d'accès
Paramètres | |
---|---|
model |
Obligatoire. Nom de |
Corps de la requête
Le corps de la requête contient des données présentant la structure suivante :
Représentation JSON |
---|
{ "prompt": { object ( |
Champs | |
---|---|
prompt |
Obligatoire. Texte d'entrée de forme libre transmis au modèle sous forme de requête. À partir d'une requête, le modèle génère une réponse TextComplete prédit comme achèvement du texte d'entrée. |
safetySettings[] |
Facultatif. Liste d'instances qui sera appliqué à |
stopSequences[] |
Ensemble de séquences de caractères (jusqu'à cinq) qui arrêteront la génération de sortie. Si cette valeur est spécifiée, l'API s'arrête à la première apparition d'une séquence d'arrêt. La séquence d'arrêt ne sera pas incluse dans la réponse. |
temperature |
Facultatif. Permet de contrôler le caractère aléatoire de la sortie. Remarque: La valeur par défaut varie selon le modèle. Consultez l'attribut Les valeurs peuvent être comprises entre [0.0,1.0] inclus. Une valeur proche de 1,0 produira des réponses plus variées et créatives, tandis qu'une valeur plus proche de 0,0 produira généralement des réponses plus simples du modèle. |
candidateCount |
Facultatif. Nombre de réponses générées à renvoyer. Cette valeur doit être comprise entre [1 et 8] inclus. Si cette règle n'est pas configurée, la valeur par défaut est 1. |
maxOutputTokens |
Facultatif. Nombre maximal de jetons à inclure dans un candidat. Si cette règle n'est pas configurée, la valeur "outputTokenLimit" est définie par défaut dans la spécification |
topP |
Facultatif. Probabilité cumulée maximale des jetons à prendre en compte lors de l'échantillonnage. Le modèle utilise un échantillonnage combiné de top-k et de noyau. Les jetons sont triés en fonction des probabilités qui leur sont attribuées, afin que seuls les jetons les plus probables soient pris en compte. L'échantillonnage top-k limite directement le nombre maximal de jetons à prendre en compte, tandis que l'échantillonnage de Nucleus limite le nombre de jetons en fonction de la probabilité cumulée. Remarque: La valeur par défaut varie selon le modèle. Consultez l'attribut |
topK |
Facultatif. Nombre maximal de jetons à prendre en compte lors de l'échantillonnage. Le modèle utilise un échantillonnage combiné de top-k et de noyau. L'échantillonnage top-k prend en compte l'ensemble des Remarque: La valeur par défaut varie selon le modèle. Consultez l'attribut |
Corps de la réponse
Si la requête aboutit, le corps de la réponse contient une instance de GenerateTextResponse
.
Champs d'application des autorisations
Nécessite l'un des champs d'application OAuth suivants :
https://www.googleapis.com/auth/generative-language
https://www.googleapis.com/auth/generative-language.tuning
https://www.googleapis.com/auth/generative-language.tuning.readonly
https://www.googleapis.com/auth/generative-language.retriever
https://www.googleapis.com/auth/generative-language.retriever.readonly
Pour en savoir plus, consultez la page Présentation de l'authentification.