Gemini API を使用して JSON 出力を生成する


Gemini はデフォルトで非構造化テキストを生成しますが、アプリケーションによっては構造化テキストが必要です。このようなユースケースでは、自動処理に適した構造化データ形式である JSON で応答するように Gemini を制限できます。

たとえば、次のユースケースでは、モデルからの構造化された出力が必要です。

  • 新聞記事から企業情報を取得して、企業のデータベースを構築する。
  • 履歴書から標準化された情報を引き出す
  • レシピから材料を抽出し、各材料に食料品店のウェブサイトへのリンクを表示する。

プロンプトで Gemini に JSON 形式の出力を生成するように指示できますが、JSON のみが生成され、それ以外は保証されません。ただし、Gemini 1.5 Pro を使用する場合は、Gemini が常に期待される構造で応答するように、特定の JSON スキーマを response_schema フィールドに渡すことができます。

このガイドでは、任意の SDK で generateContent メソッドを使用して JSON を生成する方法について説明します。焦点はテキストのみの入力ですが、Gemini はマルチモーダル クエリに対する JSON レスポンスを生成することもできます。動画ファイルと音声ファイルを使用したマルチモーダル プロンプトの詳細については、メディア ファイルを使用したプロンプトをご覧ください。