Paylaş

3 KASIM 2025

Gemini 2.5 Pro ile yüksek doğrulukta bir finansal belge analiz sistemi oluşturma

Mithun Madhusudan

Kurucu

Vishal Dharmadhikari

Ürün Çözümleri Mühendisi

Pascal AI showcase hero

Pascal AI, milyonlarca sayfa dosya, not ve modeli işlemek için kurumsal ölçekte çalışan, yatırım fonları için tasarlanmış yapay zeka destekli bir işletim sistemidir. Bu şirketin misyonu, bir firmanın şirket içi ve dışı verilerini yapay zeka destekli bir avantaja dönüştürerek analistlerin ve BT yöneticilerinin daha hızlı ve veriye dayalı kararlar almasına yardımcı olmaktır.

Pascal AI, temsilci tabanlı iş akışlarını destekleyen bilgi grafiğini oluşturmak için çeşitli ve karmaşık finansal belgeleri olağanüstü doğrulukla yapılandırılmış metne dönüştürebilen bir belge zekası sistemine ihtiyaç duyuyordu.

Karmaşık finansal verileri ayrıştırma zorluğu

Finansal belgeler, programatik ayrıştırma açısından benzersiz ve inatçı zorluklar sunar. Pascal AI ekibi, Gemini API'yi entegre etmeden önce çeşitli OCR araçlarını ve büyük dil modellerini test etti. Bu testler sırasında sürekli olarak teknik engellerle karşılaştı:

  • Karmaşık görsel veriler: Çok eksenli grafiklerden ve trend grafiklerinden doğru verileri çıkarmak kolay değildir. Diğer modeller, orijinal görsellerde bulunmayan değerleri sık sık halüsinasyon olarak üreterek kabul edilemez güvenilirlik sorunlarına yol açtı.
  • Karmaşık tablo yapıları: Mali tablolar genellikle birleştirilmiş hücreler içerir ve hem yatay hem de dikey olarak birden fazla sayfaya yayılır. Standart ayıklama kitaplıkları genellikle bu yapıyı koruyamadığı için para birimleri veya dönemler gibi önemli bağlamlar kayboluyordu.
  • Değişken belge kalitesi: Veri kaynakları, dijital olarak oluşturulmuş dosyalardan düşük çözünürlüklü, taranmış PDF'lere kadar çeşitlilik gösterdiğinden katı ayrıştırma mantığı kırılgan hale gelir.


Pascal AI, bu karmaşıklığı halüsinasyon olmadan işleyebilecek bir ayrıştırma katmanı gerektiriyordu.

Gemini 2.5 Pro ile 2 kat daha fazla doğruluk

Pascal AI, bu zorlukların üstesinden gelmek için belge zekası yığınının temelini oluşturacak şekilde LangChain aracılığıyla Gemini 2.5 Pro'yu entegre etti.

Pascal AI'da Yapay Zeka Yöneticisi olan Kanav Anand'a göre, modelin çok formatlı muhakeme özelliği doğruluğu önemli ölçüde artırdı. Önceki çözümlerin aksine Gemini 2.5 Pro, halüsinasyonları en aza indirir ve karmaşık grafikleri, önemli finansal bağlamı koruyarak doğru bir şekilde yapılandırılmış Markdown tablolarına dönüştürür.

Pascal AI, başarıyı ölçmek için dahili bir değerlendirme grubu kullanır ve ayrıştırılan çıktının orijinal metne ne kadar yakın olduğunu belirlemek için düzenleme mesafesi hata oranını izler. Gemini 2.5 Pro, % 4 düzenleme mesafesi hata oranıyla test edilen bir sonraki en iyi modele kıyasla 2 kat daha doğru performans gösterdi. Ayrıca model, tablolar, paragraflar ve başlıklar gibi yapısal bileşenleri doğru şekilde tanımlayarak % 100 öğe bazında doğruluk elde etti.

İstem mühendisliği ile ayrıştırma mantığını basitleştirme

Gemini API, ham doğruluk oranının ötesinde geliştirme hızını da artırdı. Ekip, karmaşık belge zekası sorunlarını öncelikle kırılgan özel mantık yerine istem mühendisliği aracılığıyla çözerek yeni belge türleri kullanıma sunuldukça bunları desteklemek için hızlı bir şekilde yineleme yapabilir.

Pascal Yapay Zeka, gelecekte model düzenleme ve alana özgü finansal raporlama için ince ayar yapma gibi gelişmiş yöntemleri deneyerek ayrıştırma doğruluğunu% 100'e yakın bir seviyeye çıkarmayı hedefliyor.

Gemini modelleriyle geliştirmeye başlamak için API belgelerimizi okuyun.