3 NËNTOR 2025
Ndërtimi i një sistemi inteligjence dokumentesh financiare me saktësi të lartë me Gemini 2.5 Pro

Pascal AI është një sistem operativ i bazuar në IA, i projektuar për fondet e investimeve, që vepron në shkallë institucionale për të përpunuar miliona faqe me dosje, memo dhe modele. Misioni i tyre është të shndërrojnë të dhënat e brendshme dhe të jashtme të një firme në një avantazh të mundësuar nga IA, duke i ndihmuar analistët dhe CIO-të të marrin vendime më të shpejta dhe të bazuara në të dhëna.
Për të ndërtuar grafikun e njohurive që fuqizon rrjedhat e tyre të punës agjentike, Pascal AI kishte nevojë për një sistem inteligjence dokumentesh të aftë për të konvertuar dokumente financiare të larmishme dhe komplekse në tekst të strukturuar me saktësi të jashtëzakonshme.
Sfida e analizimit të të dhënave financiare komplekse
Dokumentet financiare paraqesin sfida unike dhe kokëforta për analizimin programatik. Përpara integrimit të Gemini API, ekipi i Pascal AI testoi mjete të ndryshme OCR dhe modele të mëdha gjuhësore, duke hasur pengesa të vazhdueshme teknike:
- Të dhëna vizuale komplekse: Nxjerrja e të dhënave të sakta nga grafikët shumëakësh dhe grafikët e trendeve nuk është e parëndësishme. Modele të tjera shpesh halucinonin vlera që nuk ishin të pranishme në pamjet origjinale, duke krijuar probleme të papranueshme besueshmërie.
- Struktura të ndërlikuara tabelash: Pasqyrat financiare shpesh paraqesin qeliza të bashkuara dhe shtrihen në faqe të shumëfishta si horizontalisht ashtu edhe vertikalisht. Bibliotekat standarde të nxjerrjes shpesh dështuan në ruajtjen e kësaj strukture, duke humbur kontekst kritik siç janë njësitë monetare ose periudhat kohore.
- Cilësi e ndryshme e dokumenteve: Burimet e të dhënave variojnë nga arkivimet dixhitale deri te PDF-të e skanuara me rezolucion të ulët, duke e bërë logjikën e ngurtë të analizimit të të dhënave të brishtë.
AI i Pascalit kërkonte një shtresë analizuese që mund të trajtonte këtë kompleksitet pa halucinacione.
Arritja e saktësisë 2 herë më të madhe me Gemini 2.5 Pro
Për të kapërcyer këto sfida, Pascal AI integroi Gemini 2.5 Pro nëpërmjet LangChain si thelbin e grumbullit të tyre të inteligjencës së dokumenteve.
Sipas Kanav Anand, Drejtuesit të IA-së në Pascal AI, arsyetimi multimodal i modelit rriti ndjeshëm saktësinë. Ndryshe nga zgjidhjet e mëparshme, Gemini 2.5 Pro minimizon halucinacionet dhe transformon me saktësi grafikët dhe grafikët kompleksë në tabela të strukturuara të uljes së çmimeve, duke ruajtur kontekstin financiar jetësor.
Për të matur suksesin, Pascal AI përdor një grup të brendshëm vlerësimi, duke ndjekur shkallën e gabimit të distancës së redaktimit për të përcaktuar se sa afër është rezultati i analizuar me tekstin origjinal. Gemini 2.5 Pro arriti një shkallë të ulët gabimi të distancës së redaktimit prej 4% , duke performuar 2 herë më saktë se modeli tjetër më i mirë i testuar. Për më tepër, modeli arriti saktësi 100% në aspektin e elementeve , duke identifikuar saktë komponentët strukturorë si tabelat, paragrafët dhe titujt.
Thjeshtimi i logjikës së analizimit me inxhinieri të shpejtë
Përtej saktësisë së papërpunuar, Gemini API përmirësoi shpejtësinë e zhvillimit. Duke zgjidhur probleme komplekse të inteligjencës së dokumenteve kryesisht përmes inxhinierisë së shpejtë në vend të logjikës së personalizuar të brishtë, ekipi mund të përsërisë shpejt për të mbështetur llojet e reja të dokumenteve sapo ato të bëhen të disponueshme.
Duke parë përpara, Pascal AI synon të çojë drejt një saktësie analizuese prej gati 100% duke eksperimentuar me metoda të përparuara, duke përfshirë orkestrimin e modelit dhe rregullimin e imët për raportimin financiar specifik të domenit.
Për të filluar ndërtimin me modelet Gemini, lexoni dokumentacionin tonë të API-t .
Kalkam
Analizë e shpejtë dhe e saktë ushqyese me CalCam dhe Gemini 2.0 Flash