Gemini Interactions API 是一项实验性 API,可让开发者使用 Gemini 模型构建生成式 AI 应用。Gemini 是 Google 旗下最强大的模型,专为多模态应用而生。它不仅能理解和处理语言、图像、音频、视频和代码等各种信息,更能跨越不同模态,实现信息的融会贯通。您可以使用 Gemini API 来实现各种用例,例如跨文本和图像进行推理、生成内容、构建对话代理、开发总结和分类系统等。
创建互动
创建新的互动。
请求正文
请求正文中包含结构如下的数据:
model ModelOption (可选)
用于生成互动的 `Model` 的名称。
如果未提供“agent”,则此属性为必需属性。
可能的值:
-
gemini-2.5-flash我们的首个混合推理模型,支持 100 万个 token 的上下文窗口,并具有思考预算。
-
gemini-2.5-flash-image我们的原生图片生成模型,在速度、灵活性和上下文理解方面经过优化。文本输入和输出的价格与 2.5 Flash 相同。
-
gemini-2.5-flash-liteGoogle 旗下最小巧且最具成本效益的模型,专为大规模使用而打造。
-
gemini-2.5-flash-lite-preview-09-2025基于 Gemini 2.5 Flash Lite 的最新模型,经过优化,可实现高成本效益、高吞吐量和高画质。
-
gemini-2.5-flash-native-audio-preview-12-2025我们的原生音频模型经过优化,可提供更高质量的音频输出,并能更好地控制语速、声音自然度、表达详略和情绪。
-
gemini-2.5-flash-preview-09-2025基于 2.5 Flash 模型的最新模型。2.5 Flash 预览版最适合大规模处理、低延迟、高数据量任务,以及智能体应用场景。
-
gemini-2.5-flash-preview-tts我们的 2.5 Flash 文字转语音模型经过优化,可生成强大的低延迟可控语音。
-
gemini-2.5-proGoogle 旗下先进的多用途模型,擅长处理编码和复杂的推理任务。
-
gemini-2.5-pro-preview-tts我们的 2.5 Pro 文字转语音音频模型经过优化,可实现强大的低延迟语音生成,从而提供更自然的输出,并更轻松地引导提示。
-
gemini-3-flash-preview我们打造的最智能的模型,专为速度而生,将前沿智能技术与出色的搜索和建立依据能力相结合。
-
gemini-3-pro-image-preview先进的图片生成和编辑模型。
-
gemini-3-pro-preview我们最为智能的模型,在推理和多模态理解方面表现卓越,并具备强大的智能体和氛围编程 (vibe coding) 功能。
-
gemini-3.1-pro-preview我们最新的 SOTA 推理模型,具有前所未有的深度和细致度,以及强大的多模态理解和编码能力。
-
gemini-3.1-flash-image-preview专业级视觉智能,兼具闪电级效率和贴近现实的生成能力。
agent AgentOption (可选)
用于生成互动的“代理”的名称。
如果未提供“model”,则为必需属性。
可能的值:
-
deep-research-pro-preview-12-2025Gemini Deep Research Agent
交互的输入(模型和代理共用)。
互动方面的系统指令。
模型在互动期间可能会调用的工具声明列表。
强制生成的回答是符合此字段中指定的 JSON 架构的 JSON 对象。
响应的 MIME 类型。如果设置了 response_format,则必须设置此字段。
仅限输入。互动是否将以流式传输。
仅限输入。是否存储响应和请求以供日后检索。
仅限输入。是否在后台运行模型交互。
generation_config GenerationConfig (可选)
模型配置
模型互动的配置参数。
`agent_config` 的替代方案。仅在设置了 `model` 时适用。
字段
控制输出的随机性。
抽样时要考虑的 token 的最大累积概率。
解码中使用的种子,用于实现可重现性。
将停止输出互动的字符序列列表。
thinking_level ThinkingLevel (可选)
模型应生成的思维令牌的级别。
可能的值:
-
minimal -
low -
medium -
high
thinking_summaries ThinkingSummaries (可选)
是否在回答中包含思路总结。
可能的值:
-
auto -
none
响应中包含的令牌数量上限。
speech_config SpeechConfig (可选)
语音互动的配置。
字段
说话者的声音。
语音的语言。
说话者的姓名,应与提示中给出的说话者姓名一致。
image_config ImageConfig (可选)
图片互动的配置。
字段
没有提供说明。
可能的值:
-
1:1 -
2:3 -
3:2 -
3:4 -
4:3 -
4:5 -
5:4 -
9:16 -
16:9 -
21:9 -
1:8 -
8:1 -
1:4 -
4:1
没有提供说明。
可能的值:
-
1K -
2K -
4K -
512
互动所用的工具。
agent_config object (可选)
代理配置
代理的配置。
`generation_config` 的替代方案。仅在设置了 `agent` 时适用。
可能的类型
多态鉴别器:type
DynamicAgentConfig
动态代理的配置。
没有提供说明。
一律设置为 "dynamic"
DeepResearchAgentConfig
Deep Research 代理的配置。
thinking_summaries ThinkingSummaries (可选)
是否在回答中包含思路总结。
可能的值:
-
auto -
none
没有提供说明。
一律设置为 "deep-research"
上一次互动的 ID(如果有)。
response_modalities ResponseModality (可选)
请求的回答模态(TEXT、IMAGE、AUDIO)。
可能的值:
-
text -
image -
audio
响应
返回 Interaction 资源。
简单请求
示例响应
{ "created": "2025-11-26T12:25:15Z", "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "object": "interaction", "outputs": [ { "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?", "type": "text" } ], "role": "model", "status": "completed", "updated": "2025-11-26T12:25:15Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 20, "total_thought_tokens": 22, "total_tokens": 49, "total_tool_use_tokens": 0 } }
多轮
示例响应
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "text", "text": "The capital of France is Paris." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 50 } ], "total_cached_tokens": 0, "total_input_tokens": 50, "total_output_tokens": 10, "total_thought_tokens": 0, "total_tokens": 60, "total_tool_use_tokens": 0 } }
图片输入
示例响应
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "text", "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 10 }, { "modality": "image", "tokens": 258 } ], "total_cached_tokens": 0, "total_input_tokens": 268, "total_output_tokens": 20, "total_thought_tokens": 0, "total_tokens": 288, "total_tool_use_tokens": 0 } }
函数调用
示例响应
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "requires_action", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "function_call", "id": "gth23981", "name": "get_weather", "arguments": { "location": "Boston, MA" } } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 100 } ], "total_cached_tokens": 0, "total_input_tokens": 100, "total_output_tokens": 25, "total_thought_tokens": 0, "total_tokens": 125, "total_tool_use_tokens": 50 } }
Deep Research
示例响应
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "agent", "outputs": [ { "type": "text", "text": "Here is a comprehensive research report on the current state of cancer research..." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 20 } ], "total_cached_tokens": 0, "total_input_tokens": 20, "total_output_tokens": 1000, "total_thought_tokens": 500, "total_tokens": 1520, "total_tool_use_tokens": 0 } }
检索互动
根据单个互动的 `Interaction.id` 检索其完整详细信息。
路径 / 查询参数
要检索的互动的唯一标识符。
如果设置为 true,则会以增量方式流式传输生成的内容。
默认为:False
可选。如果设置,则从由事件 ID 标记的事件之后的下一个块恢复互动流。仅当“stream”为 true 时才可使用。
如果设置为 true,则在回答中包含输入内容。
默认为:False
要使用的 API 版本。
响应
返回 Interaction 资源。
获取互动
示例响应
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "role": "model", "outputs": [ { "type": "text", "text": "I'm doing great, thank you for asking! How can I help you today?" } ] }
删除互动
按 ID 删除互动。
路径 / 查询参数
要删除的互动的唯一标识符。
要使用的 API 版本。
响应
如果成功,则响应为空。
删除互动
取消互动
按 ID 取消互动。这仅适用于仍在运行的后台互动。
路径 / 查询参数
要取消的互动的唯一标识符。
要使用的 API 版本。
响应
返回 Interaction 资源。
取消互动
示例响应
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "cancelled", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "role": "agent" }
资源
互动
Interaction 资源。
字段
model ModelOption (可选)
用于生成互动的 `Model` 的名称。
可能的值:
-
gemini-2.5-flash我们的首个混合推理模型,支持 100 万个 token 的上下文窗口,并具有思考预算。
-
gemini-2.5-flash-image我们的原生图片生成模型,在速度、灵活性和上下文理解方面经过优化。文本输入和输出的价格与 2.5 Flash 相同。
-
gemini-2.5-flash-liteGoogle 旗下最小巧且最具成本效益的模型,专为大规模使用而打造。
-
gemini-2.5-flash-lite-preview-09-2025基于 Gemini 2.5 Flash Lite 的最新模型,经过优化,可实现高成本效益、高吞吐量和高画质。
-
gemini-2.5-flash-native-audio-preview-12-2025我们的原生音频模型经过优化,可提供更高质量的音频输出,并能更好地控制语速、声音自然度、表达详略和情绪。
-
gemini-2.5-flash-preview-09-2025基于 2.5 Flash 模型的最新模型。2.5 Flash 预览版最适合大规模处理、低延迟、高数据量任务,以及智能体应用场景。
-
gemini-2.5-flash-preview-tts我们的 2.5 Flash 文字转语音模型经过优化,可生成强大的低延迟可控语音。
-
gemini-2.5-proGoogle 旗下先进的多用途模型,擅长处理编码和复杂的推理任务。
-
gemini-2.5-pro-preview-tts我们的 2.5 Pro 文字转语音音频模型经过优化,可实现强大的低延迟语音生成,从而提供更自然的输出,并更轻松地引导提示。
-
gemini-3-flash-preview我们打造的最智能的模型,专为速度而生,将前沿智能技术与出色的搜索和建立依据能力相结合。
-
gemini-3-pro-image-preview先进的图片生成和编辑模型。
-
gemini-3-pro-preview我们最为智能的模型,在推理和多模态理解方面表现卓越,并具备强大的智能体和氛围编程 (vibe coding) 功能。
-
gemini-3.1-pro-preview我们最新的 SOTA 推理模型,具有前所未有的深度和细致度,以及强大的多模态理解和编码能力。
-
gemini-3.1-flash-image-preview专业级视觉智能,兼具闪电级效率和贴近现实的生成能力。
agent AgentOption (可选)
用于生成互动的“代理”的名称。
可能的值:
-
deep-research-pro-preview-12-2025Gemini Deep Research Agent
仅限输出。互动完成的唯一标识符。
仅限输出。互动的状态。
可能的值:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
仅限输出。回答的创建时间,采用 ISO 8601 格式 (YYYY-MM-DDThh:mm:ssZ)。
仅限输出。回答的上次更新时间,采用 ISO 8601 格式 (YYYY-MM-DDThh:mm:ssZ)。
仅限输出。互动的角色。
仅限输出。模型给出的回答。
互动方面的系统指令。
模型在互动期间可能会调用的工具声明列表。
使用情况 使用情况 (可选)
仅限输出。互动请求的令牌使用情况统计信息。
字段
提示(上下文)中的 token 数量。
input_tokens_by_modality ModalityTokens (可选)
按模态划分的输入令牌用量细分。
字段
modality ResponseModality (可选)
与令牌数量关联的模态。
可能的值:
-
text -
image -
audio
模态的令牌数量。
提示的缓存部分(即缓存的内容)中的 token 数量。
cached_tokens_by_modality ModalityTokens (可选)
按模态划分的缓存令牌使用情况细分。
字段
modality ResponseModality (可选)
与令牌数量关联的模态。
可能的值:
-
text -
image -
audio
模态的令牌数量。
所有生成的回答中的 token 总数。
output_tokens_by_modality ModalityTokens (可选)
按模态划分的输出 token 用量细分。
字段
modality ResponseModality (可选)
与令牌数量关联的模态。
可能的值:
-
text -
image -
audio
模态的令牌数量。
工具使用提示中的 token 数量。
tool_use_tokens_by_modality ModalityTokens (可选)
按模态划分的工具使用情况令牌用量细分。
字段
modality ResponseModality (可选)
与令牌数量关联的模态。
可能的值:
-
text -
image -
audio
模态的令牌数量。
思考模型的想法的词元数。
互动请求(提示 + 回答 + 其他内部 token)的总 token 数。
response_modalities ResponseModality (可选)
请求的回答模态(TEXT、IMAGE、AUDIO)。
可能的值:
-
text -
image -
audio
强制生成的回答是符合此字段中指定的 JSON 架构的 JSON 对象。
响应的 MIME 类型。如果设置了 response_format,则必须设置此字段。
上一次互动的 ID(如果有)。
交互的输入(模型和代理共用)。
agent_config object (可选)
代理互动的配置参数。
可能的类型
多态鉴别器:type
DynamicAgentConfig
动态代理的配置。
没有提供说明。
一律设置为 "dynamic"
DeepResearchAgentConfig
Deep Research 代理的配置。
thinking_summaries ThinkingSummaries (可选)
是否在回答中包含思路总结。
可能的值:
-
auto -
none
没有提供说明。
一律设置为 "deep-research"
示例
示例
{ "created": "2025-12-04T15:01:45Z", "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "object": "interaction", "outputs": [ { "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?", "type": "text" } ], "role": "model", "status": "completed", "updated": "2025-12-04T15:01:45Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 23, "total_thought_tokens": 49, "total_tokens": 79, "total_tool_use_tokens": 0 } }
数据模型
内容
回答的内容。
可能的类型
多态鉴别器:type
TextContent
文本内容块。
文本内容。
注释 注释 (可选)
模型生成的内容的引用信息。
可能的类型
多态鉴别器:type
UrlCitation
网址引用注释。
网址。
相应网址的标题。
没有提供说明。
一律设置为 "url_citation"
归因于相应来源的回答片段的起始位置。
归因段落的结束,不包括此索引。
FileCitation
文件引用注释。
文件的 URI。
相应文件的名称。
文本部分归因的来源。
没有提供说明。
一律设置为 "file_citation"
归因于相应来源的回答片段的起始位置。
归因段落的结束,不包括此索引。
PlaceCitation
地点引用注释。
地点的 ID,采用 `places/{place_id}` 格式。
地点的标题。
地点的 URI 引用。
review_snippets ReviewSnippet (可选)
用于生成有关 Google 地图中指定地点的特征的回答的评价摘要。
字段
评价的标题。
与 Google 地图上的用户评价对应的链接。
评价摘要的 ID。
没有提供说明。
一律设置为 "place_citation"
归因于相应来源的回答片段的起始位置。
归因段落的结束,不包括此索引。
没有提供说明。
一律设置为 "text"
ImageContent
图片内容块。
图片内容。
图片的 URI。
图片的 MIME 类型。
可能的值:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif
分辨率 MediaResolution (可选)
媒体的分辨率。
可能的值:
-
low -
medium -
high -
ultra_high
没有提供说明。
一律设置为 "image"
AudioContent
音频内容块。
音频内容。
相应音频的 URI。
音频的 MIME 类型。
可能的值:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac
没有提供说明。
一律设置为 "audio"
DocumentContent
文档内容块。
文档内容。
文档的 URI。
文档的 MIME 类型。
可能的值:
-
application/pdf
没有提供说明。
一律设置为 "document"
VideoContent
视频内容块。
视频内容。
视频的 URI。
视频的 MIME 类型。
可能的值:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
分辨率 MediaResolution (可选)
媒体的分辨率。
可能的值:
-
low -
medium -
high -
ultra_high
没有提供说明。
一律设置为 "video"
ThoughtContent
一个想法内容块。
与要纳入生成内容的后端来源相匹配的签名。
总结 ThoughtSummaryContent (可选)
想法的总结。
可能的类型
多态鉴别器:type
TextContent
文本内容块。
文本内容。
注释 注释 (可选)
模型生成的内容的引用信息。
可能的类型
多态鉴别器:type
UrlCitation
网址引用注释。
网址。
相应网址的标题。
没有提供说明。
一律设置为 "url_citation"
归因于相应来源的回答片段的起始位置。
归因段落的结束,不包括此索引。
FileCitation
文件引用注释。
文件的 URI。
相应文件的名称。
文本部分归因的来源。
没有提供说明。
一律设置为 "file_citation"
归因于相应来源的回答片段的起始位置。
归因段落的结束,不包括此索引。
PlaceCitation
地点引用注释。
地点的 ID,采用 `places/{place_id}` 格式。
地点的标题。
地点的 URI 引用。
review_snippets ReviewSnippet (可选)
用于生成有关 Google 地图中指定地点的特征的回答的评价摘要。
字段
评价的标题。
与 Google 地图上的用户评价对应的链接。
评价摘要的 ID。
没有提供说明。
一律设置为 "place_citation"
归因于相应来源的回答片段的起始位置。
归因段落的结束,不包括此索引。
没有提供说明。
一律设置为 "text"
ImageContent
图片内容块。
图片内容。
图片的 URI。
图片的 MIME 类型。
可能的值:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif
分辨率 MediaResolution (可选)
媒体的分辨率。
可能的值:
-
low -
medium -
high -
ultra_high
没有提供说明。
一律设置为 "image"
没有提供说明。
一律设置为 "thought"
FunctionCallContent
函数工具调用内容块。
要调用的工具的名称。
要传递给函数的实参。
没有提供说明。
一律设置为 "function_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
FunctionResultContent
函数工具结果内容块。
所调用工具的名称。
工具调用是否导致了错误。
工具调用的结果。
没有提供说明。
一律设置为 "function_result"
用于与函数调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
CodeExecutionCallContent
代码执行内容。
实参 CodeExecutionCallArguments (必需)
要传递给代码执行的实参。
字段
相应 `code` 的编程语言。
可能的值:
-
python
要执行的代码。
没有提供说明。
一律设置为 "code_execution_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
CodeExecutionResultContent
代码执行结果内容。
代码执行的输出。
代码执行是否导致了错误。
没有提供说明。
一律设置为 "code_execution_result"
用于与代码执行调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
UrlContextCallContent
网址上下文内容。
实参 UrlContextCallArguments (必需)
要传递给网址上下文的实参。
字段
要提取的网址。
没有提供说明。
一律设置为 "url_context_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
UrlContextResultContent
网址上下文结果内容。
result UrlContextResult (必需)
网址上下文的结果。
字段
提取的网址。
网址检索的状态。
可能的值:
-
success -
error -
paywall -
unsafe
网址上下文是否导致了错误。
没有提供说明。
一律设置为 "url_context_result"
用于与网址上下文调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
GoogleSearchCallContent
Google 搜索内容。
实参 GoogleSearchCallArguments (必需)
要传递给 Google 搜索的实参。
字段
后续网络搜索的网页搜索查询。
已启用的搜索接地类型。
可能的值:
-
web_search -
image_search
没有提供说明。
一律设置为 "google_search_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
GoogleSearchResultContent
Google 搜索结果内容。
result GoogleSearchResult (必需)
Google 搜索的结果。
字段
可嵌入网页或应用 WebView 中的 Web 内容代码段。
Google 搜索是否导致了错误。
没有提供说明。
一律设置为 "google_search_result"
用于与 Google 搜索调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
McpServerToolCallContent
MCPServer 工具调用内容。
所调用工具的名称。
所用 MCP 服务器的名称。
函数的实参 JSON 对象。
没有提供说明。
一律设置为 "mcp_server_tool_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
McpServerToolResultContent
MCPServer 工具结果内容。
针对此特定工具调用而调用的工具的名称。
所用 MCP 服务器的名称。
MCP 服务器调用的输出。可以是纯文本,也可以是富媒体内容。
没有提供说明。
一律设置为 "mcp_server_tool_result"
与 MCP 服务器工具调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
FileSearchCallContent
文件搜索内容。
没有提供说明。
一律设置为 "file_search_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
FileSearchResultContent
文件搜索结果内容。
result FileSearchResult (可选)
文件搜索的结果。
没有提供说明。
一律设置为 "file_search_result"
与文件搜索调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
GoogleMapsCallContent
Google 地图内容。
arguments GoogleMapsCallArguments (可选)
要传递给 Google 地图工具的实参。
字段
要执行的查询。
没有提供说明。
一律设置为 "google_maps_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
GoogleMapsResultContent
Google 地图搜索结果内容。
result GoogleMapsResult (必需)
Google 地图的结果。
字段
地点 地点 (可选)
找到的地点。
字段
地点的 ID,采用 `places/{place_id}` 格式。
地点的标题。
地点的 URI 引用。
review_snippets ReviewSnippet (可选)
用于生成有关 Google 地图中指定地点的特征的回答的评价摘要。
字段
评价的标题。
与 Google 地图上的用户评价对应的链接。
评价摘要的 ID。
Google 地图 widget 上下文令牌的资源名称。
没有提供说明。
一律设置为 "google_maps_result"
与 Google 地图调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
示例
文本
{ "type": "text", "text": "Hello, how are you?" }
图片
{ "type": "image", "data": "BASE64_ENCODED_IMAGE", "mime_type": "image/png" }
音频
{ "type": "audio", "data": "BASE64_ENCODED_AUDIO", "mime_type": "audio/wav" }
文档
{ "type": "document", "data": "BASE64_ENCODED_DOCUMENT", "mime_type": "application/pdf" }
视频
{ "type": "video", "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg" }
思考
{ "type": "thought", "summary": [ { "type": "text", "text": "The user is asking about the weather. I should use the get_weather tool." } ], "signature": "CoMDAXLI2nynRYojJIy6B1Jh9os2crpWLfB0+19xcLsGG46bd8wjkF/6RNlRUdvHrXyjsHkG0BZFcuO/bPOyA6Xh5jANNgx82wPHjGExN8A4ZQn56FlMwyZoqFVQz0QyY1lfibFJ2zU3J87uw26OewzcuVX0KEcs+GIsZa3EA6WwqhbsOd3wtZB3Ua2Qf98VAWZTS5y/tWpql7jnU3/CU7pouxQr/Bwft3hwnJNesQ9/dDJTuaQ8Zprh9VRWf1aFFjpIueOjBRrlT3oW6/y/eRl/Gt9BQXCYTqg/38vHFUU4Wo/d9dUpvfCe/a3o97t2Jgxp34oFKcsVb4S5WJrykIkw+14DzVnTpCpbQNFckqvFLuqnJCkL0EQFtunBXI03FJpPu3T1XU6id8S7ojoJQZSauGUCgmaLqUGdMrd08oo81ecoJSLs51Re9N/lISGmjWFPGpqJLoGq6uo4FHz58hmeyXCgHG742BHz2P3MiH1CXHUT2J8mF6zLhf3SR9Qb3lkrobAh" }
函数调用
{ "type": "function_call", "name": "get_weather", "id": "gth23981", "arguments": { "location": "Boston, MA" } }
函数结果
{ "type": "function_result", "name": "get_weather", "call_id": "gth23981", "result": [ { "type": "text", "text": "{\"weather\":\"sunny\"}" } ] }
代码执行调用
{ "type": "code_execution_call", "id": "call_123456", "arguments": { "language": "python", "code": "print('hello world')" } }
代码执行结果
{ "type": "code_execution_result", "call_id": "call_123456", "result": "hello world" }
网址上下文调用
{ "type": "url_context_call", "id": "call_123456", "arguments": { "urls": [ "https://www.example.com" ] } }
网址上下文结果
{ "type": "url_context_result", "call_id": "call_123456", "result": [ { "url": "https://www.example.com", "status": "SUCCESS" } ] }
Google 搜索通话
{ "type": "google_search_call", "id": "call_123456", "arguments": { "queries": [ "weather in Boston" ] } }
Google 搜索结果
{ "type": "google_search_result", "call_id": "call_123456", "result": [ { "url": "https://www.google.com/search?q=weather+in+Boston", "title": "Weather in Boston" } ] }
MCP 服务器工具调用
{ "type": "mcp_server_tool_call", "id": "call_123456", "name": "get_forecast", "server_name": "weather_server", "arguments": { "city": "London" } }
MCP 服务器工具结果
{ "type": "mcp_server_tool_result", "name": "get_forecast", "server_name": "weather_server", "call_id": "call_123456", "result": "sunny" }
文件搜索调用
{ "type": "file_search_call", "id": "call_123456" }
文件搜索结果
{ "type": "file_search_result", "call_id": "call_123456", "result": [ { "text": "search result chunk", "file_search_store": "file_search_store" } ] }
Google 地图通话
{ "type": "google_maps_call", "id": "call_123456", "arguments": { "query": "best food near me" } }
Google 地图结果
{ "type": "google_maps_result", "call_id": "call_123456", "result": [ { "places": [ { "url": "https://www.google.com/maps/search/best+food+near+me", "name": "Tasty Restaurant" } ] } ] }
工具
可能的类型
多态鉴别器:type
函数
可供模型使用的工具。
函数的名称。
函数的说明。
函数的参数的 JSON 架构。
没有提供说明。
一律设置为 "function"
GoogleSearch
模型可用于搜索 Google 的工具。
要启用的搜索接地类型。
可能的值:
-
web_search -
image_search
没有提供说明。
一律设置为 "google_search"
CodeExecution
一种可供模型用来执行代码的工具。
没有提供说明。
一律设置为 "code_execution"
UrlContext
一种可供模型用来提取网址上下文的工具。
没有提供说明。
一律设置为 "url_context"
ComputerUse
一种可供模型用于与计算机互动的工具。
正在运行的环境。
可能的值:
-
browser
从模型调用中排除的预定义函数列表。
没有提供说明。
一律设置为 "computer_use"
McpServer
MCPServer 是一种可由模型调用的服务器,用于执行操作。
MCPServer 的名称。
MCPServer 端点的完整网址。 示例:“https://api.example.com/mcp”
可选:身份验证标头、超时等字段(如果需要)。
allowed_tools AllowedTools (可选)
允许使用的工具。
字段
mode ToolChoiceType (可选)
工具选择的模式。
可能的值:
-
auto -
any -
none -
validated
允许使用的工具的名称。
没有提供说明。
一律设置为 "mcp_server"
FileSearch
一种可供模型用来搜索文件的工具。
要搜索的文件搜索存储区名称。
要检索的语义检索块数量。
要应用于语义检索文档和块的元数据过滤条件。
没有提供说明。
一律设置为 "file_search"
GoogleMaps
一种可供模型用来调用 Google 地图的工具。
是否在响应的工具调用结果中返回微件上下文令牌。
用户所在位置的纬度。
用户所在位置的经度。
没有提供说明。
一律设置为 "google_maps"
示例
函数
GoogleSearch
CodeExecution
UrlContext
ComputerUse
McpServer
FileSearch
GoogleMaps
Turn
示例
用户回合
{ "role": "user", "content": [ { "type": "text", "text": "user turn" } ] }
模型旋转
{ "role": "model", "content": [ { "type": "text", "text": "model turn" } ] }
InteractionSseEvent
可能的类型
多态鉴别器:event_type
InteractionStartEvent
没有提供说明。
没有提供说明。
可能的值:
-
interaction.start
用于从相应事件恢复互动流的 event_id 令牌。
InteractionCompleteEvent
已完成的互动,输出为空,以减少载荷大小。 使用上述 ContentDelta 事件作为实际输出。
没有提供说明。
可能的值:
-
interaction.complete
用于从相应事件恢复互动流的 event_id 令牌。
InteractionStatusUpdate
没有提供说明。
没有提供说明。
可能的值:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
没有提供说明。
一律设置为 "interaction.status_update"
用于从相应事件恢复互动流的 event_id 令牌。
ContentStart
没有提供说明。
没有提供说明。
没有提供说明。
一律设置为 "content.start"
用于从相应事件恢复互动流的 event_id 令牌。
ContentDelta
没有提供说明。
delta object (必需)
没有提供说明。
可能的类型
多态鉴别器:type
TextDelta
没有提供说明。
注释 注释 (可选)
模型生成的内容的引用信息。
可能的类型
多态鉴别器:type
UrlCitation
网址引用注释。
网址。
相应网址的标题。
没有提供说明。
一律设置为 "url_citation"
归因于相应来源的回答片段的起始位置。
归因段落的结束,不包括此索引。
FileCitation
文件引用注释。
文件的 URI。
相应文件的名称。
文本部分归因的来源。
没有提供说明。
一律设置为 "file_citation"
归因于相应来源的回答片段的起始位置。
归因段落的结束,不包括此索引。
PlaceCitation
地点引用注释。
地点的 ID,采用 `places/{place_id}` 格式。
地点的标题。
地点的 URI 引用。
review_snippets ReviewSnippet (可选)
用于生成有关 Google 地图中指定地点的特征的回答的评价摘要。
字段
评价的标题。
与 Google 地图上的用户评价对应的链接。
评价摘要的 ID。
没有提供说明。
一律设置为 "place_citation"
归因于相应来源的回答片段的起始位置。
归因段落的结束,不包括此索引。
没有提供说明。
一律设置为 "text"
ImageDelta
没有提供说明。
没有提供说明。
没有提供说明。
可能的值:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif
分辨率 MediaResolution (可选)
媒体的分辨率。
可能的值:
-
low -
medium -
high -
ultra_high
没有提供说明。
一律设置为 "image"
AudioDelta
没有提供说明。
没有提供说明。
没有提供说明。
可能的值:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac
没有提供说明。
一律设置为 "audio"
DocumentDelta
没有提供说明。
没有提供说明。
没有提供说明。
可能的值:
-
application/pdf
没有提供说明。
一律设置为 "document"
VideoDelta
没有提供说明。
没有提供说明。
没有提供说明。
可能的值:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
分辨率 MediaResolution (可选)
媒体的分辨率。
可能的值:
-
low -
medium -
high -
ultra_high
没有提供说明。
一律设置为 "video"
ThoughtSummaryDelta
content ThoughtSummaryContent (可选)
要添加到想法中的新总结项。
可能的类型
多态鉴别器:type
TextContent
文本内容块。
文本内容。
注释 注释 (可选)
模型生成的内容的引用信息。
可能的类型
多态鉴别器:type
UrlCitation
网址引用注释。
网址。
相应网址的标题。
没有提供说明。
一律设置为 "url_citation"
归因于相应来源的回答片段的起始位置。
归因段落的结束,不包括此索引。
FileCitation
文件引用注释。
文件的 URI。
相应文件的名称。
文本部分归因的来源。
没有提供说明。
一律设置为 "file_citation"
归因于相应来源的回答片段的起始位置。
归因段落的结束,不包括此索引。
PlaceCitation
地点引用注释。
地点的 ID,采用 `places/{place_id}` 格式。
地点的标题。
地点的 URI 引用。
review_snippets ReviewSnippet (可选)
用于生成有关 Google 地图中指定地点的特征的回答的评价摘要。
字段
评价的标题。
与 Google 地图上的用户评价对应的链接。
评价摘要的 ID。
没有提供说明。
一律设置为 "place_citation"
归因于相应来源的回答片段的起始位置。
归因段落的结束,不包括此索引。
没有提供说明。
一律设置为 "text"
ImageContent
图片内容块。
图片内容。
图片的 URI。
图片的 MIME 类型。
可能的值:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif
分辨率 MediaResolution (可选)
媒体的分辨率。
可能的值:
-
low -
medium -
high -
ultra_high
没有提供说明。
一律设置为 "image"
没有提供说明。
一律设置为 "thought_summary"
ThoughtSignatureDelta
与要纳入生成内容的后端来源相匹配的签名。
没有提供说明。
一律设置为 "thought_signature"
FunctionCallDelta
没有提供说明。
没有提供说明。
没有提供说明。
一律设置为 "function_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
FunctionResultDelta
没有提供说明。
没有提供说明。
工具调用结果 delta。
没有提供说明。
一律设置为 "function_result"
用于与函数调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
CodeExecutionCallDelta
实参 CodeExecutionCallArguments (必需)
没有提供说明。
字段
相应 `code` 的编程语言。
可能的值:
-
python
要执行的代码。
没有提供说明。
一律设置为 "code_execution_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
CodeExecutionResultDelta
没有提供说明。
没有提供说明。
没有提供说明。
一律设置为 "code_execution_result"
用于与函数调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
UrlContextCallDelta
实参 UrlContextCallArguments (必需)
没有提供说明。
字段
要提取的网址。
没有提供说明。
一律设置为 "url_context_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
UrlContextResultDelta
result UrlContextResult (必需)
没有提供说明。
字段
提取的网址。
网址检索的状态。
可能的值:
-
success -
error -
paywall -
unsafe
没有提供说明。
没有提供说明。
一律设置为 "url_context_result"
用于与函数调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
GoogleSearchCallDelta
实参 GoogleSearchCallArguments (必需)
没有提供说明。
字段
后续网络搜索的网页搜索查询。
没有提供说明。
一律设置为 "google_search_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
GoogleSearchResultDelta
result GoogleSearchResult (必需)
没有提供说明。
字段
可嵌入网页或应用 WebView 中的 Web 内容代码段。
没有提供说明。
没有提供说明。
一律设置为 "google_search_result"
用于与函数调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
McpServerToolCallDelta
没有提供说明。
没有提供说明。
没有提供说明。
没有提供说明。
一律设置为 "mcp_server_tool_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
McpServerToolResultDelta
没有提供说明。
没有提供说明。
工具调用结果 delta。
没有提供说明。
一律设置为 "mcp_server_tool_result"
用于与函数调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
FileSearchCallDelta
没有提供说明。
一律设置为 "file_search_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
FileSearchResultDelta
result FileSearchResult (可选)
没有提供说明。
没有提供说明。
一律设置为 "file_search_result"
用于与函数调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
GoogleMapsCallDelta
arguments GoogleMapsCallArguments (可选)
要传递给 Google 地图工具的实参。
字段
要执行的查询。
没有提供说明。
一律设置为 "google_maps_call"
此特定工具调用的唯一 ID。
用于后端验证的签名哈希。
GoogleMapsResultDelta
result GoogleMapsResult (必需)
Google 地图的结果。
字段
地点 地点 (可选)
找到的地点。
字段
地点的 ID,采用 `places/{place_id}` 格式。
地点的标题。
地点的 URI 引用。
review_snippets ReviewSnippet (可选)
用于生成有关 Google 地图中指定地点的特征的回答的评价摘要。
字段
评价的标题。
与 Google 地图上的用户评价对应的链接。
评价摘要的 ID。
Google 地图 widget 上下文令牌的资源名称。
没有提供说明。
一律设置为 "google_maps_result"
用于与函数调用块中的 ID 相匹配的 ID。
用于后端验证的签名哈希。
没有提供说明。
一律设置为 "content.delta"
用于从相应事件恢复互动流的 event_id 令牌。
ContentStop
没有提供说明。
没有提供说明。
一律设置为 "content.stop"
用于从相应事件恢复互动流的 event_id 令牌。
ErrorEvent
error Error (optional)
没有提供说明。
字段
用于标识错误类型的 URI。
人类可读的错误消息。
没有提供说明。
一律设置为 "error"
用于从相应事件恢复互动流的 event_id 令牌。
示例
互动开始
{ "event_type": "interaction.start", "interaction": { "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "model": "gemini-3-flash-preview", "object": "interaction", "status": "in_progress" } }
互动完成
{ "event_type": "interaction.complete", "interaction": { "created": "2025-12-09T18:45:40Z", "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "model": "gemini-3-flash-preview", "object": "interaction", "role": "model", "status": "completed", "updated": "2025-12-09T18:45:40Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 11 } ], "total_cached_tokens": 0, "total_input_tokens": 11, "total_output_tokens": 364, "total_thought_tokens": 1120, "total_tokens": 1495, "total_tool_use_tokens": 0 } } }
互动状态更新
{ "event_type": "interaction.status_update", "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "status": "in_progress" }
内容开始
{ "event_type": "content.start", "content": { "type": "text" }, "index": 1 }
内容增量
{ "event_type": "content.delta", "delta": { "type": "text", "text": "Elara\u2019s life was a symphony of quiet moments. A librarian, she found solace in the hushed aisles, the scent of aged paper, and the predictable rhythm of her days. Her small apartment, meticulously ordered, reflected this internal calm, save" }, "index": 1 }
内容停止
{ "event_type": "content.stop", "index": 1 }
错误事件
{ "event_type": "error", "error": { "message": "Failed to get completed interaction: Result not found.", "code": "not_found" } }