3 NOV 2025
Creare un sistema di intelligence per documenti finanziari ad alta precisione con Gemini 2.5 Pro
Pascal AI è un sistema operativo basato sull'AI progettato per i fondi di investimento, che opera su scala istituzionale per elaborare milioni di pagine di documenti, memo e modelli. La loro missione è trasformare i dati interni ed esterni di un'azienda in un vantaggio basato sull'AI, aiutando analisti e CIO a prendere decisioni più rapide e basate sui dati.
Per creare il knowledge graph che alimenta i suoi flussi di lavoro agentici, Pascal AI aveva bisogno di un sistema di document intelligence in grado di convertire documenti finanziari diversi e complessi in testo strutturato con una precisione eccezionale.
La sfida dell'analisi di dati finanziari complessi
I documenti finanziari presentano sfide uniche e difficili per l'analisi programmatica. Prima di integrare l'API Gemini, il team di Pascal AI ha testato vari strumenti OCR e modelli linguistici di grandi dimensioni, riscontrando ostacoli tecnici persistenti:
- Dati visivi complessi:estrarre dati accurati da grafici multiasse e grafici delle tendenze non è banale. Altri modelli spesso generano valori non presenti nelle immagini originali, creando problemi di affidabilità inaccettabili.
- Strutture di tabelle complesse:i bilanci spesso presentano celle unite e si estendono su più pagine sia orizzontalmente che verticalmente. Le librerie di estrazione standard spesso non riuscivano a preservare questa struttura, perdendo il contesto critico, come le unità monetarie o i periodi di tempo.
- Qualità variabile dei documenti:le origini dati vanno da documenti digitali nativi a PDF scansionati a bassa risoluzione, il che rende fragile la logica di analisi rigida.
Pascal AI richiedeva un livello di analisi in grado di gestire questa complessità senza allucinazioni.
Precisione raddoppiata con Gemini 2.5 Pro
Per superare queste sfide, Pascal AI ha integrato Gemini 2.5 Pro tramite LangChain come componente principale del suo stack di document intelligence.
Secondo Kanav Anand, AI Lead di Pascal AI, il ragionamento multimodale del modello ha aumentato significativamente l'accuratezza. A differenza delle soluzioni precedenti, Gemini 2.5 Pro riduce al minimo le allucinazioni e trasforma con precisione grafici e diagrammi complessi in tabelle markdown strutturate, preservando il contesto finanziario essenziale.
Per misurare il successo, Pascal AI utilizza un set di valutazione interno, monitorando il tasso di errore della distanza di modifica per determinare quanto l'output analizzato si avvicina al testo originale. Gemini 2.5 Pro ha ottenuto un basso tasso di errore di distanza di modifica del 4% , con prestazioni due volte più accurate rispetto al modello successivo migliore testato. Inoltre, il modello ha raggiunto una precisione elemento per elemento del 100%, identificando correttamente i componenti strutturali come tabelle, paragrafi e intestazioni.
Semplificare la logica di analisi con l'ingegneria dei prompt
Oltre all'accuratezza grezza, l'API Gemini ha migliorato la velocità di sviluppo. Risolvendo problemi complessi di document intelligence principalmente tramite l'ingegneria dei prompt anziché una logica personalizzata fragile, il team può eseguire iterazioni rapidamente per supportare i nuovi tipi di documenti man mano che diventano disponibili.
In futuro, Pascal AI mira a raggiungere un'accuratezza di analisi pari a quasi il 100% sperimentando metodi avanzati, tra cui l'orchestrazione e l'ottimizzazione dei modelli per la generazione di report finanziari specifici per il dominio.
Per iniziare a creare con i modelli Gemini, leggi la nostra documentazione dell'API.