3 NOV. 2025
Créer un système d'intelligence pour les documents financiers de haute précision avec Gemini 2.5 Pro
Pascal AI est un système d'exploitation natif de l'IA conçu pour les fonds d'investissement. Il fonctionne à l'échelle institutionnelle pour traiter des millions de pages de documents, de notes et de modèles. Leur mission est de transformer les données internes et externes d'une entreprise en un avantage basé sur l'IA, en aidant les analystes et les DSI à prendre des décisions plus rapidement et basées sur les données.
Pour créer le graphique de connaissances qui alimente ses workflows agentiques, Pascal AI avait besoin d'un système d'intelligence documentaire capable de convertir des documents financiers complexes et variés en texte structuré avec une précision exceptionnelle.
Le défi de l'analyse des données financières complexes
Les documents financiers présentent des défis uniques et tenaces pour l'analyse programmatique. Avant d'intégrer l'API Gemini, l'équipe Pascal AI a testé différents outils OCR et grands modèles de langage, rencontrant des difficultés techniques persistantes :
- Données visuelles complexes : extraire des données précises à partir de graphiques multiaxes et de graphiques de tendances n'est pas une tâche simple. D'autres modèles ont fréquemment halluciné des valeurs qui n'étaient pas présentes dans les visuels d'origine, ce qui a créé des problèmes de fiabilité inacceptables.
- Structures de tableau complexes : les états financiers comportent souvent des cellules fusionnées et s'étendent sur plusieurs pages, à la fois horizontalement et verticalement. Les bibliothèques d'extraction standards ne parvenaient souvent pas à préserver cette structure, ce qui entraînait la perte de contexte essentiel, comme les unités monétaires ou les périodes.
- Qualité variable des documents : les sources de données vont des documents numériques aux PDF numérisés en basse résolution, ce qui fragilise la logique d'analyse rigide.
Pascal AI avait besoin d'une couche d'analyse syntaxique capable de gérer cette complexité sans hallucination.
Obtenir une précision deux fois supérieure avec Gemini 2.5 Pro
Pour relever ces défis, Pascal AI a intégré Gemini 2.5 Pro via LangChain au cœur de sa pile d'intelligence documentaire.
Selon Kanav Anand, responsable de l'IA chez Pascal AI, le raisonnement multimodal du modèle a considérablement amélioré la précision. Contrairement aux solutions précédentes, Gemini 2.5 Pro minimise les hallucinations et transforme avec précision les graphiques et tableaux complexes en tableaux Markdown structurés, tout en préservant le contexte financier essentiel.
Pour mesurer le succès, Pascal AI utilise un ensemble d'évaluation interne et suit le taux d'erreur de distance d'édition pour déterminer la proximité entre le résultat analysé et le texte d'origine. Gemini 2.5 Pro a obtenu un faible taux d'erreur de distance d'édition de 4 %, soit deux fois plus de précision que le deuxième meilleur modèle testé. De plus, le modèle a atteint une précision de 100 % au niveau des éléments, en identifiant correctement les composants structurels tels que les tableaux, les paragraphes et les en-têtes.
Simplifier la logique d'analyse avec le prompt engineering
Au-delà de la précision brute, l'API Gemini a amélioré la vitesse de développement. En résolvant des problèmes complexes d'intelligence documentaire principalement grâce à l'ingénierie des requêtes plutôt qu'à une logique personnalisée fragile, l'équipe peut itérer rapidement pour prendre en charge de nouveaux types de documents dès qu'ils sont disponibles.
À l'avenir, Pascal AI vise à atteindre une précision d'analyse de près de 100 % en testant des méthodes avancées, y compris l'orchestration et l'affinage de modèles pour les rapports financiers spécifiques à un domaine.
Pour commencer à créer avec les modèles Gemini, consultez notre documentation sur l'API.