Interactions API 现已正式发布。我们建议使用此 API 来访问所有最新功能和模型。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Interactions API

Interactions API 是我们的新接口，也是使用 Gemini 模型和智能体进行构建的最直接方式。截至 2026 年 6 月，该接口已正式发布，是所有新项目的推荐接口。

虽然现在被视为旧版，但原始 generateContent API 仍完全受支持。

为什么要使用 Interactions API？

开箱即用的新功能：使用 previous_interaction_id 的可选服务器端对话状态、用于调试和界面呈现的可观测执行步骤，以及使用 background=true 的长时间运行任务的后台执行。
缓存命中率更高，费用更低：服务器端状态管理可实现更高效的跨轮次上下文缓存，从而降低多轮对话的令牌费用。
专为前沿模型和智能体而打造：专为思考模型、多步骤工具使用和复杂的推理流程而打造，可简化智能体应用的构建、调试和编排过程。
适用于模型和智能体的单个 API：一个统一的接口，可直接调用 Gemini 模型和智能体（例如 Deep Research 和自定义托管智能体），无需学习单独的端点或模式。
新功能的发布平台：未来，除了核心主线系列之外的新模型和功能以及新的智能体功能和工具，都将在 Interactions API 上发布。

默认情况下，Interactions API 会存储请求，以便您可以使用 previous_interaction_id 利用服务器端状态管理功能。您可以将 store=false 设置为选择无状态行为。如需了解详情，请参阅数据保留部分。

开始使用

设置编码智能体：连接到 Gemini 文档 MCP 并安装 gemini-interactions-api 技能，让您的助理可以直接访问最新的开发者文档和最佳实践。设置编码智能体 →
从 generateContent 迁移**：如果您有现有集成，请按照迁移指南过渡到 Interactions API。
开始使用：请参阅 Interactions API 开始使用指南。

功能指南

通过这些指南了解 Interactions API 的具体功能。您可以使用这些页面上的切换开关在 generateContent 和 Interactions API 之间切换：

Interactions API 的工作原理

Interactions API 以核心资源 Interaction 为中心。Interaction 表示对话或任务中的完整轮次。它充当会话记录，包含互动的完整历史记录，即按时间顺序排列的执行步骤 。这些步骤包括模型思考、服务器端或客户端工具调用和结果（例如 function_call 和 function_result）以及最终的 model_output。存储的资源（通过 interactions.get 检索）还包括 user_input 步骤，以提供完整上下文，但 interactions.create 响应仅返回模型生成的步骤。

当您调用 interactions.create时，您将创建一个新的 Interaction 资源。

服务器端状态管理

您可以在后续调用中使用 previous_interaction_id 参数，使用已完成互动的 id 继续对话。服务器使用此 ID 检索对话记录，从而避免您重新发送整个聊天记录。

previous_interaction_id 参数仅使用 previous_interaction_id 保留对话记录（输入和输出）。其他参数是互动范围 的，仅适用于您当前生成的特定互动：

tools
system_instruction
generation_config（包括 thinking_level、temperature 等）

这意味着，如果您希望这些参数生效，则必须在每个新互动中重新指定这些参数。此服务器端状态管理是可选的；您也可以在无状态模式下运行，即在每个请求中发送完整的对话记录。

数据存储和保留

默认情况下，API 会存储所有 Interaction 对象 (store=true)，以便简化服务器端状态管理功能（使用 previous_interaction_id）、后台执行（使用 background=true）和可观测性用途。

付费层级：系统会将互动保留 55 天。
免费层级：系统会将互动保留 1 天。

如果您不希望这样做，可以在请求中设置 store=false。此控制与状态管理分开；您可以选择不存储任何互动。不过，请注意，store=false 与 background=true 不兼容，并且会阻止在后续轮次中使用 previous_interaction_id。

您可以随时使用 API 参考文档中的删除方法删除存储的互动。只有在知道互动 ID 的情况下，您才能删除互动。

保留期限结束后，系统会自动删除您的数据。

系统会根据条款处理 Interaction 对象。

最佳实践

缓存命中率：使用 previous_interaction_id 继续对话可让系统更轻松地利用对话记录的隐式缓存，从而提高性能并降低费用。
混合互动：您可以灵活地在对话中混合搭配智能体和模型互动。例如，您可以使用专业智能体（例如 Deep Research 智能体）进行初始数据收集，然后使用标准 Gemini 模型执行后续任务（例如总结或重新格式化），并使用 previous_interaction_id 将这些步骤关联起来。

支持的模型和智能体

模型名称	类型	模型 ID
Gemini 3.5 Flash	模型	`gemini-3.5-flash`
Gemini 3.1 Pro 预览版	模型	`gemini-3.1-pro-preview`
Gemini 3.1 Flash-Lite	模型	`gemini-3.1-flash-lite`
Gemini 3 Flash 预览版	模型	`gemini-3-flash-preview`
Gemini 2.5 Pro	模型	`gemini-2.5-pro`
Gemini 2.5 Flash	模型	`gemini-2.5-flash`
Gemini 2.5 Flash-lite	模型	`gemini-2.5-flash-lite`
Gemini 3 Pro Image	模型	`gemini-3-pro-image`
Gemini 3.1 Flash Image	模型	`gemini-3.1-flash-image`
Gemini 3.1 Flash TTS 预览版	模型	`gemini-3.1-flash-tts-preview`
Gemma 4 31B IT	模型	`gemma-4-31b-it`
Gemma 4 26B MoE IT	模型	`gemma-4-26b-a4b-it`
Lyria 3 Clip 预览版	模型	`lyria-3-clip-preview`
Lyria 3 Pro 预览版	模型	`lyria-3-pro-preview`
Deep Research 预览版	智能体	`deep-research-preview-04-2026`
Deep Research 预览版	智能体	`deep-research-max-preview-04-2026`
Antigravity 预览版	智能体	`antigravity-preview-05-2026`

SDK

您可以使用最新版本的 Google GenAI SDK 来访问 Interactions API。

在 Python 上，这是 2.3.0 及更高版本的 google-genai 软件包。
在 JavaScript 上，这是 2.3.0 及更高版本的 @google/genai 软件包。

如需详细了解如何在库页面上安装 SDK，请参阅此页面。

限制

远程 MCP：Gemini 3 不支持远程 MCP，此功能即将推出。

generateContent API 支持以下功能，但 Interactions API 尚不支持 ：

视频元数据：video_metadata 字段，用于为视频理解设置剪辑间隔和自定义帧速率。
批量 API
自动函数调用 (Python)
显式缓存：请注意，Interactions API 中可通过 previous_interaction_id 使用服务器端隐式缓存。

反馈

您的反馈对于 Interactions API 的开发至关重要。欢迎在 Google AI 开发者社区论坛上分享您的想法、报告 bug 或请求功能。

后续步骤

试用 Interactions API 快速入门笔记本。
详细了解 Gemini Deep Research 智能体。