۳ نوامبر ۲۰۲۵
ساخت یک سیستم اطلاعاتی اسناد مالی با دقت بالا با Gemini 2.5 Pro

Pascal AI یک سیستم عامل مبتنی بر هوش مصنوعی است که برای صندوقهای سرمایهگذاری طراحی شده و در مقیاس سازمانی برای پردازش میلیونها صفحه از پروندهها، یادداشتها و مدلها عمل میکند. ماموریت آنها تبدیل دادههای داخلی و خارجی یک شرکت به یک مزیت مبتنی بر هوش مصنوعی است که به تحلیلگران و مدیران ارشد فناوری اطلاعات کمک میکند تا تصمیمات سریعتر و مبتنی بر داده بگیرند.
برای ساخت گراف دانشی که گردشهای کاری عاملمحور آنها را تقویت میکند، Pascal AI به یک سیستم هوشمندی اسناد نیاز داشت که بتواند اسناد مالی متنوع و پیچیده را با دقت فوقالعاده به متن ساختاریافته تبدیل کند.
چالش تجزیه و تحلیل دادههای مالی پیچیده
اسناد مالی چالشهای منحصر به فرد و سرسختی را برای تجزیه و تحلیل برنامهنویسی ارائه میدهند. قبل از ادغام API Gemini، تیم هوش مصنوعی Pascal ابزارهای مختلف OCR و مدلهای زبانی بزرگ را آزمایش کرد و با موانع فنی مداومی روبرو شد:
- دادههای بصری پیچیده: استخراج دادههای دقیق از نمودارهای چند محوری و نمودارهای روند، کار سادهای نیست. مدلهای دیگر اغلب مقادیری را که در تصاویر اصلی وجود ندارند، توهم میکنند و مشکلات غیرقابل قبولی در قابلیت اطمینان ایجاد میکنند.
- ساختارهای پیچیده جدول: صورتهای مالی اغلب دارای سلولهای ادغامشده هستند و چندین صفحه را به صورت افقی و عمودی در بر میگیرند. کتابخانههای استخراج استاندارد اغلب در حفظ این ساختار شکست میخورند و زمینههای حیاتی مانند واحدهای ارزی یا دورههای زمانی را از دست میدهند.
- کیفیت متنوع اسناد: منابع داده از بایگانیهای دیجیتال گرفته تا PDFهای اسکنشده با وضوح پایین متغیر هستند و منطق تجزیه و تحلیل سفت و سخت را شکننده میکنند.
هوش مصنوعی پاسکال به یک لایه تجزیه نیاز داشت که بتواند این پیچیدگی را بدون توهم مدیریت کند.
دستیابی به دقت دو برابر بیشتر با Gemini 2.5 Pro
برای غلبه بر این چالشها، Pascal AI از طریق LangChain، Gemini 2.5 Pro را به عنوان هسته اصلی پشته هوش اسناد خود ادغام کرد.
به گفته کاناو آناند، سرپرست هوش مصنوعی در Pascal AI، استدلال چندوجهی این مدل به طور قابل توجهی دقت را افزایش داده است. برخلاف راهحلهای قبلی، Gemini 2.5 Pro توهمات را به حداقل میرساند و نمودارها و گرافهای پیچیده را به طور دقیق به جداول تخفیف ساختاریافته تبدیل میکند و زمینه مالی حیاتی را حفظ میکند.
برای سنجش موفقیت، Pascal AI از یک مجموعه ارزیابی داخلی استفاده میکند و نرخ خطای فاصله ویرایش را ردیابی میکند تا مشخص کند خروجی تجزیهشده چقدر به متن اصلی نزدیک است. Gemini 2.5 Pro به نرخ خطای فاصله ویرایش پایین ۴٪ دست یافت و دو برابر دقیقتر از بهترین مدل بعدی آزمایششده عمل کرد. علاوه بر این، این مدل به دقت ۱۰۰٪ در عناصر دست یافت و اجزای ساختاری مانند جداول، پاراگرافها و سرصفحهها را به درستی شناسایی کرد.
سادهسازی منطق تجزیه با مهندسی سریع
فراتر از دقت خام، رابط برنامهنویسی نرمافزار Gemini سرعت توسعه را بهبود بخشید. با حل مشکلات پیچیده هوش اسناد، عمدتاً از طریق مهندسی سریع به جای منطق سفارشی شکننده، تیم میتواند به سرعت برای پشتیبانی از انواع جدید اسناد، همزمان با در دسترس قرار گرفتن آنها، تکرار کند.
با نگاهی به آینده، Pascal AI قصد دارد با آزمایش روشهای پیشرفته، از جمله تنظیم مدل و تنظیم دقیق برای گزارشگری مالی خاص دامنه، به دقت تجزیه نزدیک به ۱۰۰٪ دست یابد.
برای شروع ساخت با مدلهای Gemini، مستندات API ما را مطالعه کنید.
کالکام
تجزیه و تحلیل سریع و دقیق تغذیهای با CalCam و Gemini 2.0 Flash