2025 年 11 月 3 日
使用 Gemini 2.5 Pro 建構高精確度的財務文件智慧系統
Pascal AI 是專為投資基金設計的 AI 原生作業系統,可處理數百萬頁的申請文件、備忘錄和模型,運作規模可達機構等級。他們的使命是將公司的內部和外部資料轉化為 AI 輔助的優勢,協助分析師和資訊長更快根據資料做出決策。
為了建構知識圖譜,支援代理工作流程,Pascal AI 需要文件智慧系統,能夠以極高的準確度,將各種複雜的財務文件轉換為結構化文字。
剖析複雜金融資料的難題
財務文件在程式輔助剖析方面,會帶來獨特且難以解決的挑戰。在整合 Gemini API 之前,Pascal AI 團隊測試了各種 OCR 工具和大型語言模型,但遇到持續性的技術障礙:
- 複雜的視覺化資料:從多軸圖表和趨勢圖中擷取準確資料並不容易。其他模型經常會產生原始圖片中沒有的值,造成無法接受的可靠性問題。
- 複雜的表格結構:財務報表通常會合併儲存格,並在水平和垂直方向跨越多個頁面。標準擷取程式庫通常無法保留這個結構,因此會遺失重要背景資訊,例如貨幣單位或時間範圍。
- 文件品質不一:資料來源包括原生數位檔案和低解析度的掃描 PDF,導致嚴格的剖析邏輯變得脆弱。
Pascal AI 需要剖析層,才能處理這項複雜度,且不會產生幻覺。
Gemini 2.5 Pro 的準確度提升 2 倍
為克服這些挑戰,Pascal AI 透過 LangChain 整合 Gemini 2.5 Pro,做為文件智慧堆疊的核心。
Pascal AI 的 AI 負責人 Kanav Anand 表示,該模型的多模態推理能力大幅提升了準確度。與先前的解決方案不同,Gemini 2.5 Pro 可減少產生錯覺,並準確地將複雜的圖表轉換為結構化 Markdown 表格,保留重要的財務背景資訊。
為評估成效,Pascal AI 會使用內部評估集,追蹤編輯距離錯誤率,判斷剖析輸出內容與原始文字的接近程度。Gemini 2.5 Pro 的編輯距離錯誤率僅 4% ,準確度是我們測試過的其他最佳模型的兩倍。此外,模型還達到100% 的元素準確率,可正確識別表格、段落和標題等結構化元件。
運用提示工程簡化剖析邏輯
除了原始準確度外,Gemini API 也提升了開發速度。團隊主要透過提示工程解決複雜的文件智慧問題,而非使用脆弱的自訂邏輯,因此可以快速疊代,支援新推出的文件類型。
展望未來,Pascal AI 團隊將嘗試採用進階方法,包括模型協調和針對特定領域財務報表的微調,力求達到近乎 100% 的剖析準確度。
如要開始使用 Gemini 模型建構應用程式,請參閱 API 說明文件。