3 НОЯБРЯ 2025 ГОДА
Создание высокоточной системы анализа финансовых документов с помощью Gemini 2.5 Pro

Pascal AI — это операционная система на базе искусственного интеллекта, разработанная для инвестиционных фондов, работающих в институциональном масштабе и обрабатывающих миллионы страниц документов, служебных записок и моделей. Их миссия — превратить внутренние и внешние данные компании в преимущество на базе искусственного интеллекта, помогая аналитикам и ИТ-директорам быстрее принимать решения на основе данных.
Чтобы построить граф знаний, на основе которого будут строиться агентские рабочие процессы, Pascal AI нуждалась в системе анализа документов, способной преобразовывать разнообразные сложные финансовые документы в структурированный текст с исключительной точностью.
Проблема анализа сложных финансовых данных
Финансовые документы представляют собой уникальные и трудноразрешимые проблемы для программного анализа. Перед интеграцией API Gemini команда Pascal AI протестировала различные инструменты OCR и крупные языковые модели, столкнувшись с постоянными техническими трудностями:
- Сложные визуальные данные: извлечение точных данных из многоосевых диаграмм и графиков трендов — нетривиальная задача. Другие модели часто искажали значения, отсутствующие в исходных визуальных данных, что приводило к неприемлемым проблемам с надёжностью.
- Сложная структура таблиц: финансовые отчёты часто содержат объединённые ячейки и занимают несколько страниц как по горизонтали, так и по вертикали. Стандартные библиотеки извлечения данных часто не сохраняют эту структуру, теряя важный контекст, такой как денежные единицы или временные периоды.
- Различное качество документов: источники данных варьируются от оригинальных цифровых документов до отсканированных PDF-файлов с низким разрешением, что делает жесткую логику синтаксического анализа нестабильной.
Для Pascal AI требовался уровень синтаксического анализа, который мог бы справиться с такой сложностью без галлюцинаций.
Достижение в 2 раза большей точности с Gemini 2.5 Pro
Чтобы преодолеть эти проблемы, Pascal AI интегрировал Gemini 2.5 Pro через LangChain в качестве ядра своего стека интеллектуального анализа документов.
По словам Канава Ананда, руководителя направления ИИ в Pascal AI, мультимодальный подход модели значительно повысил точность. В отличие от предыдущих решений, Gemini 2.5 Pro минимизирует галлюцинации и точно преобразует сложные графики и диаграммы в структурированные таблицы с уценкой, сохраняя важный финансовый контекст.
Для оценки успешности Pascal AI использует внутренний набор оценок, отслеживая частоту ошибок в редактируемом расстоянии , чтобы определить, насколько близки результаты анализа к исходному тексту. Gemini 2.5 Pro достигла низкой частоты ошибок в редактируемом расстоянии — 4% , что в два раза выше точности следующей по эффективности протестированной модели. Более того, модель достигла 100% поэлементной точности , правильно определив структурные компоненты, такие как таблицы, абзацы и заголовки.
Упрощение логики синтаксического анализа с помощью оперативной инженерии
Помимо высокой точности, API Gemini повысил скорость разработки. Решая сложные задачи анализа документов, в первую очередь, за счёт оперативной разработки, а не гибкой пользовательской логики, команда может быстро переходить к поддержке новых типов документов по мере их появления.
В перспективе Pascal AI планирует приблизиться к точности анализа, близкой к 100%, путем экспериментов с передовыми методами, включая оркестровку моделей и тонкую настройку для финансовой отчетности в конкретной предметной области.
Чтобы приступить к разработке с использованием моделей Gemini, прочтите нашу документацию по API .
Калькам
Быстрый и точный анализ питания с помощью CalCam и Gemini 2.0 Flash