3 de noviembre de 2025
Cómo crear un sistema de inteligencia de documentos financieros de alta precisión con Gemini 2.5 Pro
Pascal AI es un sistema operativo nativo de IA diseñado para fondos de inversión que opera a escala institucional para procesar millones de páginas de presentaciones, memorandos y modelos. Su misión es convertir los datos internos y externos de una empresa en una ventaja potenciada por IA, lo que ayuda a los analistas y a los CIO a tomar decisiones basadas en datos con mayor rapidez.
Para crear el gráfico de conocimiento que impulsa sus flujos de trabajo basados en agentes, Pascal AI necesitaba un sistema de inteligencia de documentos capaz de convertir documentos financieros diversos y complejos en texto estructurado con una precisión excepcional.
El desafío de analizar datos financieros complejos
Los documentos financieros presentan desafíos únicos y persistentes para el análisis programático. Antes de integrar la API de Gemini, el equipo de IA de Pascal probó varias herramientas de OCR y modelos de lenguaje grandes, y se encontró con obstáculos técnicos persistentes:
- Datos visuales complejos: Extraer datos precisos de gráficos de tendencias y de varios ejes no es una tarea trivial. Otros modelos alucinaban con frecuencia valores que no estaban presentes en los elementos visuales originales, lo que generaba problemas de confiabilidad inaceptables.
- Estructuras de tablas complejas: Los estados financieros suelen incluir celdas combinadas y abarcar varias páginas tanto horizontal como verticalmente. Las bibliotecas de extracción estándar a menudo no conservaban esta estructura, lo que provocaba la pérdida de contexto crítico, como unidades de moneda o períodos.
- Calidad variable de los documentos: Las fuentes de datos abarcan desde documentos digitales nativos hasta PDFs escaneados de baja resolución, lo que hace que la lógica de análisis rígida sea frágil.
La IA de Pascal requería una capa de análisis que pudiera manejar esta complejidad sin alucinaciones.
Logramos una precisión 2 veces mayor con Gemini 2.5 Pro
Para superar estos desafíos, Pascal AI integró Gemini 2.5 Pro a través de LangChain como el núcleo de su pila de inteligencia de documentos.
Según Kanav Anand, director de IA de Pascal AI, el razonamiento multimodal del modelo aumentó significativamente la precisión. A diferencia de las soluciones anteriores, Gemini 2.5 Pro minimiza las alucinaciones y transforma con precisión gráficos complejos en tablas estructuradas de Markdown, lo que preserva el contexto financiero vital.
Para medir el éxito, Pascal AI utiliza un conjunto de evaluación interno y hace un seguimiento de la tasa de error de distancia de edición para determinar qué tan cerca está el resultado analizado del texto original. Gemini 2.5 Pro alcanzó un bajo 4% de tasa de error de distancia de edición, con un rendimiento 2 veces más preciso que el siguiente mejor modelo probado. Además, el modelo logró una precisión del 100% en cada elemento, ya que identificó correctamente los componentes estructurales, como tablas, párrafos y encabezados.
Simplifica la lógica de análisis con la ingeniería de instrucciones
Más allá de la precisión sin procesar, la API de Gemini mejoró la velocidad de desarrollo. Al resolver problemas complejos de inteligencia de documentos principalmente a través de la ingeniería de instrucciones en lugar de una lógica personalizada frágil, el equipo puede realizar iteraciones rápidamente para admitir nuevos tipos de documentos a medida que estén disponibles.
En el futuro, Pascal AI tiene como objetivo alcanzar una precisión de análisis cercana al 100% experimentando con métodos avanzados, como la orquestación y el ajuste del modelo para la generación de informes financieros específicos del dominio.
Para comenzar a compilar con los modelos de Gemini, lee nuestra documentación de la API.