3 NOV 2025
Membangun sistem kecerdasan dokumen keuangan dengan akurasi tinggi menggunakan Gemini 2.5 Pro
Pascal AI adalah sistem operasi yang dibuat khusus untuk AI dan dirancang untuk dana investasi, yang beroperasi dalam skala institusional untuk memproses jutaan halaman pengajuan, memo, dan model. Misi mereka adalah mengubah data internal dan eksternal perusahaan menjadi keunggulan yang didukung AI, sehingga membantu analis dan CIO membuat keputusan berbasis data yang lebih cepat.
Untuk membangun grafik pengetahuan yang mendukung alur kerja berbasis agen mereka, Pascal AI memerlukan sistem intelijen dokumen yang mampu mengonversi beragam dokumen keuangan yang kompleks menjadi teks terstruktur dengan akurasi yang luar biasa.
Tantangan dalam mengurai data keuangan yang kompleks
Dokumen keuangan menimbulkan tantangan unik dan sulit diatasi untuk penguraian terprogram. Sebelum mengintegrasikan Gemini API, tim Pascal AI menguji berbagai alat OCR dan model bahasa besar, dan mengalami kendala teknis yang terus-menerus:
- Data visual yang kompleks: Mengekstrak data yang akurat dari diagram multi-sumbu dan grafik tren tidaklah mudah. Model lain sering kali berhalusinasi nilai yang tidak ada dalam visual asli, sehingga menimbulkan masalah keandalan yang tidak dapat diterima.
- Struktur tabel yang rumit: Laporan keuangan sering kali menampilkan sel gabungan dan mencakup beberapa halaman secara horizontal dan vertikal. Library ekstraksi standar sering kali gagal mempertahankan struktur ini, sehingga kehilangan konteks penting seperti unit mata uang atau jangka waktu.
- Kualitas dokumen yang bervariasi: Sumber data berkisar dari pengajuan digital hingga PDF yang dipindai beresolusi rendah, sehingga logika penguraian yang kaku menjadi tidak efektif.
Pascal AI memerlukan lapisan parsing yang dapat menangani kompleksitas ini tanpa halusinasi.
Mencapai akurasi 2x lebih tinggi dengan Gemini 2.5 Pro
Untuk mengatasi tantangan ini, Pascal AI mengintegrasikan Gemini 2.5 Pro melalui LangChain sebagai inti dari stack kecerdasan dokumen mereka.
Menurut Kanav Anand, AI Lead di Pascal AI, penalaran multimodal model tersebut secara signifikan meningkatkan akurasi. Tidak seperti solusi sebelumnya, Gemini 2.5 Pro meminimalkan halusinasi dan secara akurat mengubah grafik dan diagram yang kompleks menjadi tabel markdown terstruktur, sehingga mempertahankan konteks keuangan yang penting.
Untuk mengukur keberhasilan, Pascal AI menggunakan set evaluasi internal, yang melacak tingkat kesalahan jarak pengeditan untuk menentukan seberapa dekat output yang diuraikan dengan teks asli. Gemini 2.5 Pro mencapai tingkat error jarak pengeditan 4% yang rendah, dengan performa 2x lebih akurat daripada model terbaik berikutnya yang diuji. Selain itu, model ini mencapai akurasi per elemen 100%, dengan mengidentifikasi komponen struktural seperti tabel, paragraf, dan header dengan benar.
Menyederhanakan logika parsing dengan rekayasa perintah
Selain akurasi mentah, Gemini API meningkatkan kecepatan pengembangan. Dengan memecahkan masalah kompleks terkait kecerdasan dokumen terutama melalui teknik perintah, bukan logika kustom yang rapuh, tim dapat melakukan iterasi dengan cepat untuk mendukung jenis dokumen baru saat tersedia.
Ke depannya, Pascal AI bertujuan untuk mencapai akurasi penguraian mendekati 100% dengan bereksperimen menggunakan metode lanjutan, termasuk orkestrasi dan penyesuaian model untuk pelaporan keuangan khusus domain.
Untuk mulai membangun aplikasi dengan model Gemini, baca dokumentasi API kami.