اشتراک گذاری

۳ نوامبر ۲۰۲۵

ساخت یک سیستم اطلاعاتی اسناد مالی با دقت بالا با Gemini 2.5 Pro

میتون مادهوسودان

بنیانگذار

ویشال دارمادیکاری

مهندس راهکارهای محصول

قهرمان نمایش هوش مصنوعی پاسکال

Pascal AI یک سیستم عامل مبتنی بر هوش مصنوعی است که برای صندوق‌های سرمایه‌گذاری طراحی شده و در مقیاس سازمانی برای پردازش میلیون‌ها صفحه از پرونده‌ها، یادداشت‌ها و مدل‌ها عمل می‌کند. ماموریت آنها تبدیل داده‌های داخلی و خارجی یک شرکت به یک مزیت مبتنی بر هوش مصنوعی است که به تحلیلگران و مدیران ارشد فناوری اطلاعات کمک می‌کند تا تصمیمات سریع‌تر و مبتنی بر داده بگیرند.

برای ساخت گراف دانشی که گردش‌های کاری عامل‌محور آنها را تقویت می‌کند، Pascal AI به یک سیستم هوشمندی اسناد نیاز داشت که بتواند اسناد مالی متنوع و پیچیده را با دقت فوق‌العاده به متن ساختاریافته تبدیل کند.

چالش تجزیه و تحلیل داده‌های مالی پیچیده

اسناد مالی چالش‌های منحصر به فرد و سرسختی را برای تجزیه و تحلیل برنامه‌نویسی ارائه می‌دهند. قبل از ادغام API Gemini، تیم هوش مصنوعی Pascal ابزارهای مختلف OCR و مدل‌های زبانی بزرگ را آزمایش کرد و با موانع فنی مداومی روبرو شد:

  • داده‌های بصری پیچیده: استخراج داده‌های دقیق از نمودارهای چند محوری و نمودارهای روند، کار ساده‌ای نیست. مدل‌های دیگر اغلب مقادیری را که در تصاویر اصلی وجود ندارند، توهم می‌کنند و مشکلات غیرقابل قبولی در قابلیت اطمینان ایجاد می‌کنند.
  • ساختارهای پیچیده جدول: صورت‌های مالی اغلب دارای سلول‌های ادغام‌شده هستند و چندین صفحه را به صورت افقی و عمودی در بر می‌گیرند. کتابخانه‌های استخراج استاندارد اغلب در حفظ این ساختار شکست می‌خورند و زمینه‌های حیاتی مانند واحدهای ارزی یا دوره‌های زمانی را از دست می‌دهند.
  • کیفیت متنوع اسناد: منابع داده از بایگانی‌های دیجیتال گرفته تا PDFهای اسکن‌شده با وضوح پایین متغیر هستند و منطق تجزیه و تحلیل سفت و سخت را شکننده می‌کنند.


هوش مصنوعی پاسکال به یک لایه تجزیه نیاز داشت که بتواند این پیچیدگی را بدون توهم مدیریت کند.

دستیابی به دقت دو برابر بیشتر با Gemini 2.5 Pro

برای غلبه بر این چالش‌ها، Pascal AI از طریق LangChain، Gemini 2.5 Pro را به عنوان هسته اصلی پشته هوش اسناد خود ادغام کرد.

به گفته کاناو آناند، سرپرست هوش مصنوعی در Pascal AI، استدلال چندوجهی این مدل به طور قابل توجهی دقت را افزایش داده است. برخلاف راه‌حل‌های قبلی، Gemini 2.5 Pro توهمات را به حداقل می‌رساند و نمودارها و گراف‌های پیچیده را به طور دقیق به جداول تخفیف ساختاریافته تبدیل می‌کند و زمینه مالی حیاتی را حفظ می‌کند.

برای سنجش موفقیت، Pascal AI از یک مجموعه ارزیابی داخلی استفاده می‌کند و نرخ خطای فاصله ویرایش را ردیابی می‌کند تا مشخص کند خروجی تجزیه‌شده چقدر به متن اصلی نزدیک است. Gemini 2.5 Pro به نرخ خطای فاصله ویرایش پایین ۴٪ دست یافت و دو برابر دقیق‌تر از بهترین مدل بعدی آزمایش‌شده عمل کرد. علاوه بر این، این مدل به دقت ۱۰۰٪ در عناصر دست یافت و اجزای ساختاری مانند جداول، پاراگراف‌ها و سرصفحه‌ها را به درستی شناسایی کرد.

ساده‌سازی منطق تجزیه با مهندسی سریع

فراتر از دقت خام، رابط برنامه‌نویسی نرم‌افزار Gemini سرعت توسعه را بهبود بخشید. با حل مشکلات پیچیده هوش اسناد، عمدتاً از طریق مهندسی سریع به جای منطق سفارشی شکننده، تیم می‌تواند به سرعت برای پشتیبانی از انواع جدید اسناد، همزمان با در دسترس قرار گرفتن آنها، تکرار کند.

با نگاهی به آینده، Pascal AI قصد دارد با آزمایش روش‌های پیشرفته، از جمله تنظیم مدل و تنظیم دقیق برای گزارشگری مالی خاص دامنه، به دقت تجزیه نزدیک به ۱۰۰٪ دست یابد.

برای شروع ساخت با مدل‌های Gemini، مستندات API ما را مطالعه کنید.

کالکام

تجزیه و تحلیل سریع و دقیق تغذیه‌ای با CalCam و Gemini 2.0 Flash