共有

2025 年 11 月 3 日

Gemini 2.5 Pro を使用して高精度の財務ドキュメント インテリジェンス システムを構築する

Mithun Madhusudan

創業者

Vishal Dharmadhikari

プロダクト ソリューション エンジニア

Pascal AI のショーケースのヒーロー

Pascal AI は、投資ファンド向けに設計された AI ネイティブのオペレーティング システムです。機関投資家規模で運用され、数百万ページの申請書類、メモ、モデルを処理します。同社の使命は、企業の内部データと外部データを AI を活用した優位性に変え、アナリストや CIO がデータに基づいた意思決定を迅速に行えるようにすることです。

エージェント ワークフローを強化するナレッジグラフを構築するために、Pascal AI は、多様で複雑な財務ドキュメントを非常に高い精度で構造化テキストに変換できるドキュメント インテリジェンス システムを必要としていました。

複雑な財務データの解析の課題

財務書類は、プログラムによる解析において特有の困難な課題をもたらします。Gemini API を統合する前に、Pascal AI チームはさまざまな OCR ツールと大規模言語モデルをテストしましたが、次のような技術的な問題が繰り返し発生しました。

  • 複雑な視覚データ: 複数軸のグラフやトレンド グラフから正確なデータを抽出するのは簡単ではありません。他のモデルでは、元のビジュアルに存在しない値を頻繁にハルシネーションし、信頼性の問題が発生していました。
  • 複雑な表構造: 財務諸表では、セルが結合され、複数のページにわたって水平方向と垂直方向に広がっていることがよくあります。標準の抽出ライブラリでは、この構造が保持されず、通貨単位や期間などの重要なコンテキストが失われることがよくありました。
  • ドキュメントの品質が異なる: データソースは、デジタルネイティブのファイリングから低解像度のスキャン PDF まで多岐にわたるため、厳密な解析ロジックが脆弱になります。


Pascal AI には、この複雑さを幻覚なしで処理できる解析レイヤが必要でした。

Gemini 2.5 Pro で精度が 2 倍に向上

これらの課題を克服するため、Pascal AI は LangChain を介して Gemini 2.5 Pro をドキュメント インテリジェンス スタックの中核として統合しました。

Pascal AI の AI リードである Kanav Anand 氏によると、モデルのマルチモーダル推論により精度が大幅に向上しました。以前のソリューションとは異なり、Gemini 2.5 Pro はハルシネーションを最小限に抑え、複雑なグラフやチャートを構造化された Markdown テーブルに正確に変換し、重要な財務コンテキストを保持します。

成功を測定するために、Pascal AI は内部評価セットを使用し、編集距離エラー率を追跡して、解析された出力が元のテキストにどれだけ近いかを判断します。Gemini 2.5 Pro は、編集距離エラー率 4% という低いエラー率を達成し、テストされた次善のモデルよりも2 倍の精度を達成しました。さらに、このモデルは要素ごとの精度 100% を達成し、表、段落、見出しなどの構造コンポーネントを正しく識別しました。

プロンプト エンジニアリングによる解析ロジックの簡素化

Gemini API は、精度だけでなく、開発のスピードも向上させました。チームは、複雑なドキュメント インテリジェンスの問題を、脆弱なカスタム ロジックではなく、主にプロンプト エンジニアリングによって解決することで、新しいドキュメント タイプが利用可能になったときに迅速に反復処理してサポートできます。

今後、Pascal AI は、モデル オーケストレーションやドメイン固有の財務レポートのファインチューニングなどの高度な手法を試すことで、解析精度を 100% に近づけることを目指しています。

Gemini モデルを使用した構築を開始するには、API ドキュメントをご覧ください。