REST Resource: models

资源:Model

生成式语言模型的相关信息。

JSON 表示法
{
  "name": string,
  "baseModelId": string,
  "version": string,
  "displayName": string,
  "description": string,
  "inputTokenLimit": integer,
  "outputTokenLimit": integer,
  "supportedGenerationMethods": [
    string
  ],
  "temperature": number,
  "topP": number,
  "topK": integer
}
字段
name

string

必需。Model 的资源名称。

格式:models/{model}{model} 命名惯例为:

  • “{baseModelId}-{version}”

示例:

  • models/chat-bison-001
baseModelId

string

必需。基本模型的名称,将其传递给生成请求。

示例:

  • chat-bison
version

string

必需。模型的版本号。

这表示主版本号

displayName

string

人类可读的模型名称。例如,“Chat Bison”。

名称不得超过 128 个字符,可以包含任何 UTF-8 字符。

description

string

模型的简短说明。

inputTokenLimit

integer

此模型允许的输入令牌数量上限。

outputTokenLimit

integer

此模型可用的输出令牌的数量上限。

supportedGenerationMethods[]

string

模型支持的生成方法。

方法名称定义为 Pascal 大小写字符串,例如与 API 方法对应的 generateMessage

temperature

number

控制输出的随机性。

值的范围在 [0.0,1.0](含)以上。值越接近 1.0,回答就越多样化,而值越接近 0.0,模型给出的回答一般越不出乎意料。此值指定后端在调用模型时要使用的默认值。

topP

number

用于 Nucleus 采样。

核采样考虑概率总和至少为 topP 的最小词元集。此值指定后端在调用模型时要使用的默认值。

topK

integer

用于 Top-k 采样。

Top-k 采样考虑 topK 集合中概率最高的词元。此值指定后端在调用模型时要使用的默认值。如果为空,则表示模型不使用 Top-k 采样,并且不允许将 topK 用作生成参数。

方法

batchEmbedContents

在同步调用中指定输入文本,根据模型生成多个嵌入。

countTokens

对输入内容运行模型的分词器,并返回词元数。

embedContent

在给定输入 Content 的情况下,从模型生成嵌入。

generateContent

根据输入 GenerateContentRequest 从模型生成回答。

get

获取有关特定模型的信息。

list

列出可通过 API 使用的模型。

streamGenerateContent

根据输入 GenerateContentRequest 从模型生成流式响应。