शेयर करें

3 नवंबर, 2025

Gemini 2.5 Pro की मदद से, फ़ाइनेंशियल दस्तावेज़ों से जुड़ी जानकारी को सटीक तरीके से समझने वाला सिस्टम बनाना

मिथुन मधुसूदन

फ़ाउंडर

विशाल धर्माधिकारी

प्रॉडक्ट सॉल्यूशंस इंजीनियर

पास्कल एआई शोकेस हीरो

Pascal AI, एआई पर आधारित एक ऑपरेटिंग सिस्टम है. इसे इन्वेस्टमेंट फ़ंड के लिए डिज़ाइन किया गया है. यह संस्थागत स्तर पर काम करता है. साथ ही, लाखों पेजों की फ़ाइलिंग, मेमो, और मॉडल को प्रोसेस करता है. इनका मकसद, किसी कंपनी के इंटरनल और एक्सटर्नल डेटा को एआई की मदद से बेहतर बनाना है. इससे एनालिस्ट और सीआईओ को डेटा के आधार पर तेज़ी से फ़ैसले लेने में मदद मिलती है.

Pascal AI को अपने एजेंटिक वर्कफ़्लो को बेहतर बनाने के लिए, एक ऐसे नॉलेज ग्राफ़ की ज़रूरत थी जो दस्तावेज़ों से जुड़ी जानकारी को प्रोसेस कर सके. इसके लिए, उसे एक ऐसे सिस्टम की ज़रूरत थी जो अलग-अलग तरह के मुश्किल फ़ाइनेंशियल दस्तावेज़ों को सटीक तरीके से स्ट्रक्चर्ड टेक्स्ट में बदल सके.

जटिल फ़ाइनेंशियल डेटा को पार्स करने की चुनौती

वित्तीय दस्तावेज़ों को प्रोग्राम के हिसाब से पार्स करने में, कई तरह की समस्याएं आती हैं. Gemini API को इंटिग्रेट करने से पहले, Pascal AI की टीम ने कई ओसीआर टूल और लार्ज लैंग्वेज मॉडल की जांच की. इस दौरान, उन्हें लगातार तकनीकी समस्याओं का सामना करना पड़ा:

  • जटिल विज़ुअल डेटा: मल्टी-ऐक्सिस चार्ट और ट्रेंड ग्राफ़ से सटीक डेटा निकालना आसान नहीं होता. अन्य मॉडल अक्सर ऐसी वैल्यू जनरेट करते हैं जो ओरिजनल विज़ुअल में मौजूद नहीं होती हैं. इससे, भरोसेमंद होने से जुड़ी समस्याएं पैदा होती हैं.
  • जटिल टेबल स्ट्रक्चर: वित्तीय स्टेटमेंट में अक्सर मर्ज की गई सेल होती हैं. साथ ही, ये हॉरिज़ॉन्टल और वर्टिकल, दोनों तरह से कई पेजों पर फैली होती हैं. स्टैंडर्ड एक्सट्रैक्शन लाइब्रेरी, अक्सर इस स्ट्रक्चर को बनाए नहीं रख पाती थीं. इस वजह से, मुद्रा की इकाइयों या समयावधि जैसे ज़रूरी कॉन्टेक्स्ट की जानकारी नहीं मिल पाती थी.
  • दस्तावेज़ की क्वालिटी अलग-अलग होना: डेटा सोर्स में, डिजिटल फ़ाइलिंग से लेकर कम रिज़ॉल्यूशन वाले स्कैन किए गए PDF तक शामिल होते हैं. इससे पार्सिंग लॉजिक को समझना मुश्किल हो जाता है.


Pascal AI को एक ऐसी पार्सिंग लेयर की ज़रूरत थी जो बिना किसी गलत जानकारी के इस मुश्किल काम को पूरा कर सके.

Gemini 2.5 Pro की मदद से, पहले से दो गुना ज़्यादा सटीक जवाब पाना

इन चुनौतियों से निपटने के लिए, Pascal AI ने LangChain के ज़रिए Gemini 2.5 Pro को इंटिग्रेट किया है. यह उनके दस्तावेज़ों से जुड़ी जानकारी को मैनेज करने वाले स्टैक का मुख्य हिस्सा है.

Pascal AI के एआई लीड कनव आनंद के मुताबिक, मॉडल की मल्टीमॉडल रीज़निंग की वजह से, जवाब ज़्यादा सटीक हो गए. पिछले समाधानों के उलट, Gemini 2.5 Pro में भ्रमित करने वाली जानकारी कम से कम होती है. साथ ही, यह जटिल ग्राफ़ और चार्ट को सटीक तरीके से स्ट्रक्चर्ड मार्कडाउन टेबल में बदलता है. इससे वित्तीय जानकारी का ज़रूरी कॉन्टेक्स्ट बना रहता है.

Pascal AI की परफ़ॉर्मेंस का आकलन करने के लिए, इंटरनल इवैलुएशन सेट का इस्तेमाल किया जाता है. इसमें एडिट डिस्टेंस एरर-रेट को ट्रैक किया जाता है. इससे यह पता चलता है कि पार्स किया गया आउटपुट, ओरिजनल टेक्स्ट से कितना मिलता-जुलता है. Gemini 2.5 Pro ने 4% एडिट डिस्टेंस एरर रेट हासिल किया. यह टेस्ट किए गए दूसरे सबसे अच्छे मॉडल की तुलना में, दो गुना ज़्यादा सटीक है. इसके अलावा, मॉडल ने हर एलिमेंट के लिए 100% सटीकता हासिल की. साथ ही, टेबल, पैराग्राफ़, और हेडर जैसे स्ट्रक्चरल कॉम्पोनेंट की सही पहचान की.

प्रॉम्प्ट इंजीनियरिंग की मदद से, पार्सिंग लॉजिक को आसान बनाना

Gemini API की मदद से, न सिर्फ़ ज़्यादा सटीक जवाब मिले, बल्कि डेवलपमेंट की प्रोसेस भी तेज़ हुई. दस्तावेज़ से जुड़ी मुश्किल समस्याओं को हल करने के लिए, टीम कस्टम लॉजिक के बजाय मुख्य रूप से प्रॉम्प्ट इंजीनियरिंग का इस्तेमाल करती है. इससे टीम, नए दस्तावेज़ टाइप उपलब्ध होने पर उन्हें तुरंत सपोर्ट कर सकती है.

आने वाले समय में, Pascal AI का लक्ष्य पार्सिंग की सटीकता को 100% के करीब पहुंचाना है. इसके लिए, वह बेहतर तरीकों का इस्तेमाल करेगा. इनमें मॉडल ऑर्केस्ट्रेशन और डोमेन के हिसाब से फ़ाइनेंशियल रिपोर्टिंग के लिए फ़ाइन-ट्यूनिंग शामिल है.

Gemini मॉडल का इस्तेमाल शुरू करने के लिए, हमारा एपीआई दस्तावेज़ पढ़ें.