使用 Gemini API 生成结构化输出


Gemini 默认会生成非结构化文本,但某些应用需要结构化文本。对于这些用例,您可以限制 Gemini 以 JSON 格式(一种适合自动处理的结构化数据格式)进行响应。您还可以限制模型使用枚举中指定的选项之一进行回答。

以下是可能需要模型提供结构化输出的几种用例:

  • 从报纸文章中提取公司信息,构建公司数据库。
  • 从简历中提取标准化信息。
  • 从食谱中提取食材,并为每种食材显示指向杂货网站的链接。

在问题中,您可以要求 Gemini 生成 JSON 格式的输出,但请注意,模型无法保证只会生成 JSON 格式的输出。如需获得更确定性的响应,您可以在 responseSchema 字段中传递特定的 JSON 架构,以便 Gemini 始终以预期结构响应。

本指南介绍了如何通过您选择的 SDK 使用 generateContent 方法生成 JSON,或直接使用 REST API 生成 JSON。示例显示了纯文本输入,但 Gemini 还可以针对包含图片视频音频的多模式请求生成 JSON 响应。