Gemini API によるドキュメント処理機能の詳細

Gemini API は、渡された PDF ドキュメントを処理して実行できます。日時 PDF がアップロードされた場合、Gemini API は次のことを行えます。

  • コンテンツについて説明または回答する
  • コンテンツを要約する
  • コンテンツから推定する

このチュートリアルでは、Gemini API にプロンプトを送信する方法をいくつか紹介します。 添付されていますすべての出力はテキストのみです。

次のステップ

このガイドでは、Terraform を使用して generateContent、 を使用して、処理されたドキュメントからテキスト出力を生成します。詳しくは 次のリソースをご覧ください。

  • メディア ファイルを使用したプロンプト: Gemini API は、テキスト、画像、音声、動画データを使用したプロンプトをサポートしています。 マルチモーダル プロンプトと呼ばれます。
  • システム指示: システム 使用することで、特定の状況に基づいてモデルの動作を サポートします。
  • 安全に関するガイダンス: 場合によって生成 AI モデルは、不正確な出力など、予期しない出力を生成する 偏見がある、または不適切であるといったことを判断できます。事後処理と人間による評価は、 そのような出力による害が及ぶリスクを制限します。