Gemini API を使用してテキストを生成する

Gemini API は、テキスト、画像、動画、音声など、さまざまなタイプの入力からテキスト出力を生成できます。テキスト生成は、次のようなさまざまなアプリケーションで使用できます。

  • 創作文
  • メディア アセットの説明や解釈
  • テキスト補完
  • 自由形式のテキストの要約
  • 言語間の翻訳
  • chatbot
  • 独自のユースケース

このガイドでは、generateContent API と streamGenerateContent API を使用してテキストを生成する方法について説明します。テキストのみの入力とテキストと画像の入力からのテキスト出力に重点を置いています。動画ファイルと音声ファイルを使用したマルチモーダル プロンプトの詳細については、ファイル プロンプト戦略をご覧ください。

次のステップ

このガイドでは、generateContentstreamGenerateContent を使用して、テキストのみの入力とテキストと画像の入力からテキスト出力を生成する方法について説明します。Gemini API を使用してテキストを生成する方法については、次のリソースをご覧ください。

  • ファイル プロンプト戦略: Gemini API は、テキスト、画像、音声、動画データを使用したプロンプト(マルチモーダル プロンプトとも呼ばれます)をサポートしています。
  • システム指示: システム指示を使用すると、特定のニーズやユースケースに基づいてモデルの動作を制御できます。
  • 安全に関するガイダンス: 生成 AI モデルは、不正確な出力、偏った出力、不適切な出力など、予期しない出力を生成することがあります。このような出力による被害のリスクを軽減するには、後処理と人間による評価が不可欠です。