对输入内容运行模型的标记生成器,并返回词元计数。
HTTP 请求
POST https://generativelanguage.googleapis.com/v1beta/{model=models/*}:countTokens
网址采用 gRPC 转码语法。
路径参数
参数 | |
---|---|
model |
必需。模型的资源名称。这充当要使用的模型的 ID。 此名称应与 格式: |
请求正文
请求正文中包含结构如下的数据:
JSON 表示法 |
---|
{ "contents": [ { object ( |
字段 | |
---|---|
contents[] |
可选。作为提示提供给模型的输入。如果设置了 |
generateContentRequest |
可选。提供给模型的总体输入。models.countTokens 可统计提示、函数调用等。 |
响应正文
来自 models.countTokens
的回复。
它会针对 prompt
返回模型的 tokenCount
。
如果成功,响应正文将包含结构如下的数据:
JSON 表示法 |
---|
{ "totalTokens": integer } |
字段 | |
---|---|
totalTokens |
始终为非负数。设置 cacheContent 后,这仍是总有效提示大小。也就是说,这包括缓存内容中的令牌数量。 |
授权范围
需要以下 OAuth 范围之一:
https://www.googleapis.com/auth/generative-language
https://www.googleapis.com/auth/generative-language.tuning
https://www.googleapis.com/auth/generative-language.tuning.readonly
https://www.googleapis.com/auth/generative-language.retriever
https://www.googleapis.com/auth/generative-language.retriever.readonly
如需了解详情,请参阅身份验证概览。
GenerateContentRequest
请求根据模型生成补全。
JSON 表示法 |
---|
{ "model": string, "contents": [ { object ( |
字段 | |
---|---|
model |
必需。用于生成补全的 格式: |
contents[] |
必需。当前与模型对话的内容。 对于单轮查询,这是指单个实例。对于多轮查询,此字段是重复字段,包含对话记录和最新请求。 |
tools[] |
可选。模型可用于生成下一个回答的
|
toolConfig |
可选。请求中指定的任何 |
safetySettings[] |
可选。用于屏蔽不安全内容的唯一 这将在 |
systemInstruction |
可选。开发者设置的系统指令。目前仅支持文字广告。 |
generationConfig |
可选。用于模型生成和输出的配置选项。 |
cachedContent |
可选。用作上下文以提供预测的缓存内容的名称。注意:仅用于显式缓存。在显式缓存中,用户可以控制缓存(例如,要缓存哪些内容),并享受有保证的成本节约。格式: |