Gemini 2.5 Pro プレビュー版が本番環境で利用可能になりました。
詳細
フィードバックを送信
ドキュメントの理解
Python
JavaScript
Go
REST
Gemini API は、長いドキュメント(最大 3, 600 ページ)を含む PDF 入力をサポートしています。Gemini モデルはネイティブなビジョンで PDF を処理するため、ドキュメント内のテキストと画像の両方のコンテンツを理解できます。ネイティブの PDF ビジョンをサポートしているため、Gemini モデルは次のことができます。
ドキュメント内の図、グラフ、表を分析する
情報を構造化された出力形式に抽出する
ドキュメント内の画像とテキストの内容に関する質問に回答する
ドキュメントを要約する
下流のアプリケーションで使用するために、ドキュメントのコンテンツを(HTML などに変換して)レイアウトと書式を保持したまま文字起こしする
このチュートリアルでは、Gemini API を使用して PDF ドキュメントを処理する方法について説明します。
次のステップ
詳細については、次のリソースをご覧ください。
ファイル プロンプト戦略 : Gemini API は、テキスト、画像、音声、動画データによるプロンプト(マルチモーダル プロンプト)をサポートしています。
システム指示 : システム指示を使用すると、特定のニーズやユースケースに基づいてモデルの動作を制御できます。
フィードバックを送信
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンス により使用許諾されます。コードサンプルは Apache 2.0 ライセンス により使用許諾されます。詳しくは、Google Developers サイトのポリシー をご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-04-28 UTC。
ご意見をお聞かせください
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["必要な情報がない","missingTheInformationINeed","thumb-down"],["複雑すぎる / 手順が多すぎる","tooComplicatedTooManySteps","thumb-down"],["最新ではない","outOfDate","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["サンプル / コードに問題がある","samplesCodeIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2025-04-28 UTC。"],[],[]]