Делиться

3 НОЯБРЯ 2025 ГОДА

Создание высокоточной системы анализа финансовых документов с помощью Gemini 2.5 Pro

Митхун Мадхусудан

Основатель

Вишал Дхармадхикари

Инженер по продуктовым решениям

Герой демонстрации искусственного интеллекта на Pascal

Pascal AI — это операционная система на базе искусственного интеллекта, разработанная для инвестиционных фондов, работающих в институциональном масштабе и обрабатывающих миллионы страниц документов, служебных записок и моделей. Их миссия — превратить внутренние и внешние данные компании в преимущество на базе искусственного интеллекта, помогая аналитикам и ИТ-директорам быстрее принимать решения на основе данных.

Чтобы построить граф знаний, на основе которого будут строиться агентские рабочие процессы, Pascal AI нуждалась в системе анализа документов, способной преобразовывать разнообразные сложные финансовые документы в структурированный текст с исключительной точностью.

Проблема анализа сложных финансовых данных

Финансовые документы представляют собой уникальные и трудноразрешимые проблемы для программного анализа. Перед интеграцией API Gemini команда Pascal AI протестировала различные инструменты OCR и крупные языковые модели, столкнувшись с постоянными техническими трудностями:

  • Сложные визуальные данные: извлечение точных данных из многоосевых диаграмм и графиков трендов — нетривиальная задача. Другие модели часто искажали значения, отсутствующие в исходных визуальных данных, что приводило к неприемлемым проблемам с надёжностью.
  • Сложная структура таблиц: финансовые отчёты часто содержат объединённые ячейки и занимают несколько страниц как по горизонтали, так и по вертикали. Стандартные библиотеки извлечения данных часто не сохраняют эту структуру, теряя важный контекст, такой как денежные единицы или временные периоды.
  • Различное качество документов: источники данных варьируются от оригинальных цифровых документов до отсканированных PDF-файлов с низким разрешением, что делает жесткую логику синтаксического анализа нестабильной.


Для Pascal AI требовался уровень синтаксического анализа, который мог бы справиться с такой сложностью без галлюцинаций.

Достижение в 2 раза большей точности с Gemini 2.5 Pro

Чтобы преодолеть эти проблемы, Pascal AI интегрировал Gemini 2.5 Pro через LangChain в качестве ядра своего стека интеллектуального анализа документов.

По словам Канава Ананда, руководителя направления ИИ в Pascal AI, мультимодальный подход модели значительно повысил точность. В отличие от предыдущих решений, Gemini 2.5 Pro минимизирует галлюцинации и точно преобразует сложные графики и диаграммы в структурированные таблицы с уценкой, сохраняя важный финансовый контекст.

Для оценки успешности Pascal AI использует внутренний набор оценок, отслеживая частоту ошибок в редактируемом расстоянии , чтобы определить, насколько близки результаты анализа к исходному тексту. Gemini 2.5 Pro достигла низкой частоты ошибок в редактируемом расстоянии — 4% , что в два раза выше точности следующей по эффективности протестированной модели. Более того, модель достигла 100% поэлементной точности , правильно определив структурные компоненты, такие как таблицы, абзацы и заголовки.

Упрощение логики синтаксического анализа с помощью оперативной инженерии

Помимо высокой точности, API Gemini повысил скорость разработки. Решая сложные задачи анализа документов, в первую очередь, за счёт оперативной разработки, а не гибкой пользовательской логики, команда может быстро переходить к поддержке новых типов документов по мере их появления.

В перспективе Pascal AI планирует приблизиться к точности анализа, близкой к 100%, путем экспериментов с передовыми методами, включая оркестровку моделей и тонкую настройку для финансовой отчетности в конкретной предметной области.

Чтобы приступить к разработке с использованием моделей Gemini, прочтите нашу документацию по API .

Калькам

Быстрый и точный анализ питания с помощью CalCam и Gemini 2.0 Flash