3 LISTOPADA 2025 r.
Tworzenie systemu do analizy dokumentów finansowych o wysokiej dokładności za pomocą Gemini 2.5 Pro
Pascal AI to system operacyjny oparty na AI, przeznaczony dla funduszy inwestycyjnych. Działa na skalę instytucjonalną, przetwarzając miliony stron dokumentów, notatek i modeli. Jej misją jest przekształcanie danych wewnętrznych i zewnętrznych firmy w przewagę opartą na AI, co pomaga analitykom i dyrektorom ds. informacji podejmować szybsze decyzje oparte na danych.
Aby zbudować graf wiedzy, który zasila przepływy pracy oparte na agentach, firma Pascal AI potrzebowała systemu analizy dokumentów, który potrafi przekształcać różnorodne, złożone dokumenty finansowe w ustrukturyzowany tekst z wyjątkową dokładnością.
Trudności z analizowaniem złożonych danych finansowych
Dokumenty finansowe stanowią wyjątkowo trudne wyzwanie dla automatycznego przetwarzania. Przed zintegrowaniem interfejsu Gemini API zespół Pascal AI przetestował różne narzędzia OCR i duże modele językowe, napotykając ciągłe trudności techniczne:
- Złożone dane wizualne: wyodrębnianie dokładnych danych z wykresów wieloosiowych i wykresów trendów jest trudne. Inne modele często generowały halucynacje w postaci wartości, które nie występowały w oryginalnych obrazach, co powodowało niedopuszczalne problemy z wiarygodnością.
- Złożone struktury tabel: sprawozdania finansowe często zawierają scalone komórki i rozciągają się na wiele stron w pionie i poziomie. Standardowe biblioteki ekstrakcji często nie zachowywały tej struktury, przez co traciły kluczowe informacje, takie jak jednostki waluty czy okresy.
- Różna jakość dokumentów: źródła danych obejmują zarówno dokumenty w formie cyfrowej, jak i skany PDF w niskiej rozdzielczości, co sprawia, że sztywne reguły analizowania są podatne na błędy.
Pascal AI wymagał warstwy analizy, która poradziłaby sobie z tą złożonością bez halucynacji.
2-krotnie większa dokładność dzięki Gemini 2.5 Pro
Aby pokonać te wyzwania, firma Pascal AI zintegrowała Gemini 2.5 Pro za pomocą LangChain jako podstawę swojego stosu technologii do analizy dokumentów.
Według Kanava Ananda, szefa zespołu AI w Pascal AI, multimodalne wnioskowanie modelu znacznie zwiększyło dokładność. W odróżnieniu od poprzednich rozwiązań Gemini 2.5 Pro minimalizuje halucynacje i dokładnie przekształca złożone wykresy w ustrukturyzowane tabele w formacie Markdown, zachowując istotny kontekst finansowy.
Aby zmierzyć skuteczność, Pascal AI korzysta z wewnętrznego zestawu oceniającego, śledząc współczynnik błędów odległości edycji, aby określić, jak bardzo przeanalizowane dane wyjściowe są zbliżone do oryginalnego tekstu. Gemini 2.5 Pro osiągnął niski 4-procentowy wskaźnik błędu odległości edycji, czyli 2 razy większą dokładność niż kolejny najlepszy testowany model. Model osiągnął też 100% dokładności w przypadku poszczególnych elementów, prawidłowo rozpoznając komponenty strukturalne, takie jak tabele, akapity i nagłówki.
Upraszczanie logiki analizowania za pomocą tworzenia promptów
Oprócz samej dokładności interfejs Gemini API zwiększył szybkość rozwoju. Rozwiązując złożone problemy związane z analizą dokumentów głównie za pomocą inżynierii promptów, a nie za pomocą złożonej logiki niestandardowej, zespół może szybko wprowadzać zmiany, aby obsługiwać nowe typy dokumentów, gdy staną się dostępne.
W przyszłości Pascal AI zamierza dążyć do niemal 100% dokładności analizy składniowej, eksperymentując z zaawansowanymi metodami, w tym z orkiestracją modeli i dostrajaniem ich do raportów finansowych w określonych dziedzinach.
Aby rozpocząć tworzenie rozwiązań z użyciem modeli Gemini, zapoznaj się z naszą dokumentacją API.