REST Resource: models

资源:Model

生成式语言模型的相关信息。

JSON 表示法
{
  "name": string,
  "baseModelId": string,
  "version": string,
  "displayName": string,
  "description": string,
  "inputTokenLimit": integer,
  "outputTokenLimit": integer,
  "supportedGenerationMethods": [
    string
  ],
  "temperature": number,
  "topP": number,
  "topK": integer
}
字段
name

string

必需。Model 的资源名称。

格式:models/{model}{model} 命名惯例为:

  • “{baseModelId}-{version}”

示例:

  • models/chat-bison-001
baseModelId

string

必需。基本模型的名称,将其传递给生成请求。

示例:

  • chat-bison
version

string

必需。模型的版本号。

这表示主版本号

displayName

string

人类可读的模型名称。例如,“Chat Bison”。

名称不得超过 128 个字符,可以包含任何 UTF-8 字符。

description

string

模型的简短说明。

inputTokenLimit

integer

此模型允许的输入令牌数量上限。

outputTokenLimit

integer

此模型可用的输出令牌的数量上限。

supportedGenerationMethods[]

string

模型支持的生成方法。

方法名称定义为 Pascal 大小写字符串,例如与 API 方法对应的 generateMessage

temperature

number

控制输出的随机性。

值的范围在 [0.0,1.0](含)以上。值越接近 1.0,回答就越多样化,而值越接近 0.0,模型给出的回答一般越不出乎意料。此值指定后端在调用模型时要使用的默认值。

topP

number

用于 Nucleus 采样。

核采样考虑概率总和至少为 topP 的最小词元集。此值指定后端在调用模型时要使用的默认值。

topK

integer

用于 Top-k 采样。

Top-k 采样考虑 topK 集合中概率最高的词元。此值指定后端在调用模型时要使用的默认值。如果为空,则表示模型不使用 Top-k 采样,并且不允许将 topK 用作生成参数。

方法

batchEmbedContents

在同步调用中指定输入文本,根据模型生成多个嵌入。

batchEmbedText

在同步调用中指定输入文本,根据模型生成多个嵌入。

countMessageTokens

对字符串运行模型的分词器,并返回词元数。

countTextTokens

对文本运行模型的分词器,并返回词元数。

countTokens

对输入内容运行模型的分词器,并返回词元数。

embedContent

在给定输入 Content 的情况下,从模型生成嵌入。

embedText

根据输入消息从模型中生成嵌入。

generateAnswer

根据输入 GenerateAnswerRequest 根据模型生成依据结果的答案。

generateContent

根据输入 GenerateContentRequest 从模型生成回答。

generateMessage

根据输入 MessagePrompt 从模型生成回答。

generateText

根据输入消息,根据模型生成回复。

get

获取有关特定模型的信息。

list

列出可通过 API 使用的模型。

streamGenerateContent

根据输入 GenerateContentRequest 从模型生成流式响应。