使用 Gemini API 生成 JSON 输出


Gemini 默认生成非结构化文本,但有些应用需要结构化文本。对于这些用例,您可以限制 Gemini 使用 JSON 进行响应,这是一种适合自动处理的结构化数据格式。

例如,以下用例需要模型的结构化输出:

  • 通过从报纸文章中提取公司信息来构建公司数据库。
  • 从简历中提取标准化信息。
  • 从食谱中提取食材,并为每种食材显示一个指向杂货网站的链接。

在问题中,你可以要求 Gemini 生成 JSON 格式的输出,但请注意,Google 无法保证它生成的输出只有 JSON 且仅生成 JSON。 不过,如果您使用的是 Gemini 1.5 Pro,则可以在 response_schema 字段中传递特定的 JSON 架构,以便 Gemini 始终以预期的结构进行响应。

本指南介绍了如何通过您选择的 SDK 使用 generateContent 方法生成 JSON。虽然 Gemini 也可以为多模态查询生成 JSON 响应,但它侧重于纯文本输入。如需详细了解如何使用视频和音频文件进行多模态提示,请参阅使用媒体文件进行提示