3 KASIM 2025
Gemini 2.5 Pro ile yüksek doğrulukta bir finansal belge analiz sistemi oluşturma
Pascal AI, yatırım fonları için tasarlanmış, yapay zeka destekli bir işletim sistemidir. Milyonlarca sayfa dosya, not ve modeli işlemek için kurumsal ölçekte çalışır. Bu şirketin misyonu, bir firmanın iç ve dış verilerini yapay zeka destekli bir avantaja dönüştürerek analistlerin ve BT yöneticilerinin daha hızlı ve veriye dayalı kararlar almasına yardımcı olmaktır.
Pascal AI, temsilci tabanlı iş akışlarını destekleyen bilgi grafiğini oluşturmak için çeşitli ve karmaşık finansal belgeleri olağanüstü doğrulukla yapılandırılmış metne dönüştürebilen bir belge zekası sistemine ihtiyaç duyuyordu.
Karmaşık finansal verileri ayrıştırmanın zorluğu
Finansal belgeler, programatik ayrıştırma açısından benzersiz ve inatçı zorluklar sunar. Pascal AI ekibi, Gemini API'yi entegre etmeden önce çeşitli OCR araçlarını ve büyük dil modellerini test etti. Bu testler sırasında sürekli olarak teknik engellerle karşılaştı:
- Karmaşık görsel veriler: Çok eksenli grafiklerden ve trend grafiklerinden doğru veriler çıkarmak kolay değildir. Diğer modeller, orijinal görsellerde bulunmayan değerleri sık sık halüsinasyon olarak üreterek kabul edilemez güvenilirlik sorunlarına yol açıyordu.
- Karmaşık tablo yapıları: Mali tablolar genellikle birleştirilmiş hücreler içerir ve hem yatay hem de dikey olarak birden fazla sayfaya yayılır. Standart ayıklama kitaplıkları genellikle bu yapıyı koruyamadığı için para birimleri veya dönemler gibi önemli bağlamlar kayboluyordu.
- Çeşitli belge kalitesi: Veri kaynakları, dijital ortamda oluşturulmuş dosyalardan düşük çözünürlüklü, taranmış PDF'lere kadar çeşitlilik gösterdiğinden katı ayrıştırma mantığı kırılgan hale gelir.
Pascal AI, bu karmaşıklığı halüsinasyon olmadan işleyebilecek bir ayrıştırma katmanı gerektiriyordu.
Gemini 2.5 Pro ile 2 kat daha fazla doğruluk
Pascal AI, bu zorlukların üstesinden gelmek için belge zekası yığınının temelini oluşturacak şekilde LangChain aracılığıyla Gemini 2.5 Pro'yu entegre etti.
Pascal AI'da Yapay Zeka Yöneticisi olan Kanav Anand'a göre, modelin çok formatlı muhakeme özelliği doğruluğu önemli ölçüde artırdı. Önceki çözümlerin aksine Gemini 2.5 Pro, halüsinasyonları en aza indirir ve karmaşık grafikleri ve çizelgeleri, önemli finansal bağlamı koruyarak doğru bir şekilde yapılandırılmış Markdown tablolarına dönüştürür.
Pascal AI, başarıyı ölçmek için dahili bir değerlendirme grubu kullanır ve ayrıştırılan çıktının orijinal metne ne kadar yakın olduğunu belirlemek için düzenleme mesafesi hata oranını izler. Gemini 2.5 Pro, % 4 düzenleme mesafesi hata oranıyla test edilen bir sonraki en iyi modele kıyasla 2 kat daha doğru performans gösterdi. Ayrıca model, % 100 öğe bazında doğruluk elde ederek tablolar, paragraflar ve başlıklar gibi yapısal bileşenleri doğru şekilde tanımladı.
İstem mühendisliği ile ayrıştırma mantığını basitleştirme
Gemini API, ham doğruluk oranının yanı sıra geliştirme hızını da artırdı. Ekip, karmaşık belge zekası sorunlarını öncelikle kırılgan özel mantık yerine istem mühendisliği aracılığıyla çözerek yeni belge türleri kullanıma sunuldukça bunları desteklemek için hızlı bir şekilde yineleme yapabilir.
Pascal Yapay Zeka, gelecekte alan adlarına özgü finansal raporlama için model düzenleme ve ince ayar gibi gelişmiş yöntemlerle denemeler yaparak ayrıştırma doğruluğunu% 100'e yakın bir seviyeye çıkarmayı hedefliyor.
Gemini modelleriyle geliştirmeye başlamak için API belgelerimizi okuyun.