我们最先进的模型 Gemini 2.5 Pro Experimental 现已推出！了解详情

此页面由 Cloud Translation API 翻译。

Question answering

Semantic Retrieval API 提供托管式问答服务，可让您使用 Google 的基础架构构建检索增强生成 (RAG) 系统。

方法：models.generateAnswer

端点
路径参数
请求正文
- JSON 表示法
响应正文
- JSON 表示法
授权范围
GroundingPassages
- JSON 表示法
GroundingPassage
- JSON 表示法
SemanticRetrieverConfig
- JSON 表示法
AnswerStyle
InputFeedback
- JSON 表示法
BlockReason

在给定输入 GenerateAnswerRequest 的情况下，从模型生成有依据的回答。

端点

帖子 https://generativelanguage.googleapis.com/v1beta/{model=models/*}:generateAnswer

路径参数

model string

必需。用于生成有依据的回答的 Model 的名称。

格式：model=models/{model}。其格式为 models/{model}。

请求正文

请求正文中包含结构如下的数据：

字段

contents[] object (Content)

必需。与 Model 当前对话的内容。对于单轮查询，这是单个要回答的问题。对于多轮查询，这是包含对话历史记录和包含问题的列表中的最后一个 Content 的重复字段。

注意：models.generateAnswer 仅支持英语查询。

answerStyle enum (AnswerStyle)

必需。应返回答案的风格。

safetySettings[] object (SafetySetting)

可选。用于屏蔽不安全内容的唯一 SafetySetting 实例列表。

这将在 GenerateAnswerRequest.contents 和 GenerateAnswerResponse.candidate 上强制执行。每个 SafetyCategory 类型不应有多个设置。API 会屏蔽未达到这些设置设定的阈值的所有内容和响应。此列表会替换 safetySettings 中指定的每个 SafetyCategory 的默认设置。如果列表中提供的给定 SafetyCategory 没有 SafetySetting，则该 API 将使用该类别的默认安全设置。支持的危害类别包括 HARM_CATEGORY_HATE_SPEECH、HARM_CATEGORY_SEXUALLY_EXPLICIT、HARM_CATEGORY_DANGEROUS_CONTENT 和 HARM_CATEGORY_HARASSMENT。如需详细了解可用的安全设置，请参阅指南。此外，请参阅安全指南，了解如何在 AI 应用中纳入安全注意事项。

grounding_source Union type

用于证明回答的来源。grounding_source 只能是下列其中一项：

inlinePassages object (GroundingPassages)

随请求附上的段落。

semanticRetriever object (SemanticRetrieverConfig)

从通过 Semantic Retriever API 创建的资源检索的内容。

temperature number

可选。控制输出的随机性。

值介于 [0.0,1.0] 之间（包括这两个数值）。值越接近 1.0，生成的回答就越多样化、越富有创意；而值越接近 0.0，模型生成的回答通常就越直接。通常建议将温度设为较低值（约 0.2），以便实现归因式问答应用场景。

响应正文

模型针对有依据的回答给出的回复。

如果成功，响应正文将包含结构如下的数据：

字段

answer object (Candidate)

模型的候选答案。

注意：该模型始终会尝试提供有依据的回答，即使答案不太可能从给定段落中找到。在这种情况下，系统可能会提供低质量或缺乏依据的回答，并且 answerableProbability 较低。

answerableProbability number

仅限输出。模型对其回答正确且基于输入段落的概率的估计。

answerableProbability 较低表示答案可能并非基于相关来源。

当 answerableProbability 较低时，您可能需要：

向用户显示类似“我们无法回答该问题”的消息。
回退到通用 LLM，以便根据世界知识回答问题。此类回退的阈值和性质将取决于具体用例。0.5 是一个不错的起始阈值。

inputFeedback object (InputFeedback)

仅限输出。与用于回答问题的输入数据相关的反馈，而不是模型针对问题生成的回答。

输入数据可以是以下一项或多项：

GenerateAnswerRequest.content 中的最后一个条目指定的问题
GenerateAnswerRequest.content 中的其他条目指定的对话记录
接地来源（GenerateAnswerRequest.semantic_retriever 或 GenerateAnswerRequest.inline_passages）

JSON 表示法
{ "answer": { object (`Candidate`) }, "answerableProbability": number, "inputFeedback": { object (`InputFeedback`) } }

GroundingPassages

重复的段落列表。

字段

passages[] object (GroundingPassage)

经文列表。

JSON 表示法
{ "passages": [ { object (`GroundingPassage`) } ] }

GroundingPassage

与接地配置内嵌的段落。

字段

id string

用于在基于事实的回答中归因此段落的段落标识符。

content object (Content)

相应段落的内容。

JSON 表示法
{ "id": string, "content": { object (`Content`) } }

SemanticRetrieverConfig

用于从使用 Semantic Retriever API 创建的 Corpus 或 Document 检索基准内容的配置。

字段

source string

必需。要检索的资源的名称。示例：corpora/123 或 corpora/123/documents/abc。

query object (Content)

必需。用于按相似度匹配给定资源中的 Chunk 的查询。

metadataFilters[] object (MetadataFilter)

可选。用于从资源中选择 Document 和/或 Chunk 的过滤条件。

maxChunksCount integer

可选。要检索的相关 Chunk 的数量上限。

minimumRelevanceScore number

可选。检索到的相关 Chunk 的最低相关性得分。

JSON 表示法
{ "source": string, "query": { object (`Content`) }, "metadataFilters": [ { object (`MetadataFilter`) } ], "maxChunksCount": integer, "minimumRelevanceScore": number }

AnswerStyle

有依据的回答的样式。

枚举
`ANSWER_STYLE_UNSPECIFIED`	未指定答案样式。
`ABSTRACTIVE`	简洁但抽象的风格。
`EXTRACTIVE`	内容非常简短，采用提取式风格。
`VERBOSE`	详细样式，包含额外详细信息。回答可以采用句子、段落、多个段落或项目符号列表等格式。

InputFeedback

与用于回答问题的输入数据相关的反馈，而不是模型针对问题生成的回答。

字段

safetyRatings[] object (SafetyRating)

输入内容的安全评分。每个类别最多只能有一个分级。

blockReason enum (BlockReason)

可选。如果已设置，则表示输入已被屏蔽，系统不会返回任何候选项。改述输入内容。

JSON 表示法
{ "safetyRatings": [ { object (`SafetyRating`) } ], "blockReason": enum (`BlockReason`) }

BlockReason

指定输入被屏蔽的原因。

枚举
`BLOCK_REASON_UNSPECIFIED`	默认值。此值未使用。
`SAFETY`	输入内容因安全原因而被屏蔽。检查 `safetyRatings`，了解是哪个安全类别屏蔽了它。
`OTHER`	输入因其他原因而被屏蔽。