REST Resource: models

Recurso: Modelo

Información sobre un modelo de lenguaje generativo.

Representación JSON
{
  "name": string,
  "baseModelId": string,
  "version": string,
  "displayName": string,
  "description": string,
  "inputTokenLimit": integer,
  "outputTokenLimit": integer,
  "supportedGenerationMethods": [
    string
  ],
  "temperature": number,
  "topP": number,
  "topK": integer
}
Campos
name

string

Obligatorio. El nombre del recurso de Model.

Formato: models/{model} con una convención de nombres {model} de:

  • “{baseModelId}-{version}”

Ejemplos:

  • models/chat-bison-001
baseModelId

string

Obligatorio. El nombre del modelo base, pasar esto a la solicitud de generación.

Ejemplos:

  • chat-bison
version

string

Obligatorio. El número de versión del modelo.

Representa la versión principal

displayName

string

Es el nombre legible del modelo. Por ejemplo, "Chat Bison".

El nombre puede tener hasta 128 caracteres y puede constar de caracteres UTF-8.

description

string

Una descripción breve del modelo.

inputTokenLimit

integer

Cantidad máxima de tokens de entrada permitidos para este modelo.

outputTokenLimit

integer

Cantidad máxima de tokens de salida disponibles para este modelo.

supportedGenerationMethods[]

string

Los métodos de generación que admite el modelo.

Los nombres de los métodos se definen como cadenas de mayúsculas y minúsculas, como generateMessage, que corresponden a los métodos de la API.

temperature

number

Controla la aleatorización del resultado.

Los valores pueden ser superiores a [0.0,1.0], inclusive. Un valor más cercano a 1.0 producirá respuestas más variadas, mientras que un valor más cercano a 0.0 suele generar respuestas menos sorprendentes del modelo. Este valor especifica la configuración predeterminada que usará el backend mientras realiza la llamada al modelo.

topP

number

Para el muestreo de núcleos.

El muestreo de núcleos considera el conjunto más pequeño de tokens cuya suma de probabilidad sea al menos topP. Este valor especifica la configuración predeterminada que usará el backend mientras realiza la llamada al modelo.

topK

integer

Para el muestreo de k superior.

El muestreo de k superior considera el conjunto de tokens más probables de topK. Este valor especifica la configuración predeterminada que usará el backend mientras realiza la llamada al modelo. Si está vacío, indica que el modelo no usa el muestreo de k superior y topK no está permitido como parámetro de generación.

Métodos

batchEmbedContents

Genera varias incorporaciones a partir de un texto de entrada determinado en una llamada síncrona.

batchEmbedText

Genera varias incorporaciones a partir de un texto de entrada determinado en una llamada síncrona.

countMessageTokens

Ejecuta el tokenizador de un modelo en una string y muestra el recuento de tokens.

countTextTokens

Ejecuta el tokenizador de un modelo en un texto y muestra el recuento de tokens.

countTokens

Ejecuta el tokenizador de un modelo en el contenido de entrada y muestra el recuento de tokens.

embedContent

Genera una incorporación a partir del modelo a partir de un Content de entrada.

embedText

Genera una incorporación a partir del modelo dado un mensaje de entrada.

generateAnswer

Genera una respuesta basada en el modelo a partir de un GenerateAnswerRequest de entrada.

generateContent

Genera una respuesta del modelo a partir de un GenerateContentRequest de entrada.

generateMessage

Genera una respuesta del modelo a partir de un MessagePrompt de entrada.

generateText

Genera una respuesta del modelo dado un mensaje de entrada.

get

Obtiene información sobre un modelo específico.

list

Muestra una lista de los modelos disponibles a través de la API.

streamGenerateContent

Genera una respuesta transmitida desde el modelo según una GenerateContentRequest de entrada.