探索 Gemini API 的文档处理功能

Gemini API 可以处理传递给它的 PDF 文档并对其运行推理。上传 PDF 文件时,Gemini API 可以:

  • 描述或回答与内容相关的问题
  • 总结内容
  • 根据内容推断

本教程演示了一些可能的方法,用于向 Gemini API 提示所提供的 PDF 文档。所有输出均为文本。

后续步骤

本指南介绍了如何使用 generateContent 以及如何根据处理后的文档生成文本输出。如需了解详情,请参阅以下资源:

  • 文件提示策略:Gemini API 支持使用文本、图片、音频和视频数据进行提示,也称为多模式提示。
  • 系统说明:借助系统说明,您可以根据自己的特定需求和使用情形来控制模型的行为。
  • 安全指南:生成式 AI 模型有时会生成意外的输出,例如不准确、有偏见或令人反感的输出。后期处理和人工评估对于限制此类输出造成伤害的风险至关重要。