3 DE NOVEMBRO DE 2025
Como criar um sistema de inteligência de documentos financeiros de alta precisão com o Gemini 2.5 Pro
A Pascal AI é um sistema operacional nativo de IA projetado para fundos de investimento, operando em escala institucional para processar milhões de páginas de documentos, memorandos e modelos. A missão deles é transformar os dados internos e externos de uma empresa em uma vantagem com tecnologia de IA, ajudando analistas e CIOs a tomar decisões mais rápidas e orientadas por dados.
Para criar o grafo de conhecimento que impulsiona os fluxos de trabalho de agentes, a Pascal AI precisava de um sistema de inteligência de documentos capaz de converter documentos financeiros diversos e complexos em texto estruturado com precisão excepcional.
O desafio de analisar dados financeiros complexos
Os documentos financeiros apresentam desafios únicos e difíceis para a análise programática. Antes de integrar a API Gemini, a equipe de IA da Pascal testou várias ferramentas de OCR e modelos de linguagem grandes, encontrando obstáculos técnicos persistentes:
- Dados visuais complexos:extrair dados precisos de gráficos multieixos e de tendências não é trivial. Outros modelos alucinavam valores que não estavam presentes nos recursos visuais originais, criando problemas de confiabilidade inaceitáveis.
- Estruturas de tabela complexas:as demonstrações financeiras geralmente têm células mescladas e abrangem várias páginas na horizontal e na vertical. As bibliotecas de extração padrão geralmente não preservam essa estrutura, perdendo contexto crítico, como unidades monetárias ou períodos.
- Qualidade variada dos documentos:as fontes de dados variam de arquivos digitais a PDFs digitalizados de baixa resolução, o que torna a lógica de análise rígida frágil.
A IA Pascal precisava de uma camada de análise que pudesse lidar com essa complexidade sem alucinação.
Precisão duas vezes maior com o Gemini 2.5 Pro
Para superar esses desafios, a Pascal AI integrou o Gemini 2.5 Pro via LangChain como o núcleo da pilha de inteligência de documentos.
De acordo com Kanav Anand, líder de IA da Pascal AI, o raciocínio multimodal do modelo aumentou significativamente a acurácia. Ao contrário das soluções anteriores, o Gemini 2.5 Pro minimiza as alucinações e transforma com precisão gráficos complexos em tabelas markdown estruturadas, preservando o contexto financeiro vital.
Para medir o sucesso, a Pascal AI usa um conjunto de avaliação interno, rastreando a taxa de erro de distância de edição para determinar o quão próximo o resultado analisado está do texto original. O Gemini 2.5 Pro alcançou uma baixa taxa de erro de distância de edição de 4% , com uma precisão duas vezes maior do que o próximo melhor modelo testado. Além disso, o modelo alcançou 100% de acurácia por elemento, identificando corretamente componentes estruturais como tabelas, parágrafos e cabeçalhos.
Simplificar a lógica de análise com a engenharia de comando
Além da acurácia bruta, a API Gemini melhorou a velocidade de desenvolvimento. Ao resolver problemas complexos de inteligência de documentos principalmente com engenharia de comandos em vez de lógica personalizada frágil, a equipe pode fazer iterações rapidamente para oferecer suporte a novos tipos de documentos à medida que eles ficam disponíveis.
No futuro, a Pascal AI pretende alcançar uma acurácia de análise de quase 100% testando métodos avançados, incluindo orquestração e ajuste fino de modelos para relatórios financeiros específicos do domínio.
Para começar a criar com os modelos do Gemini, leia nossa documentação da API.