शेयर करें

3 नवंबर, 2025

Gemini 2.5 Pro की मदद से, फ़ाइनेंशियल दस्तावेज़ों से जुड़ी जानकारी को सटीक तरीके से समझने वाला सिस्टम बनाना

मिथुन मधुसूदन

फ़ाउंडर

विशाल धर्माधिकारी

प्रॉडक्ट सॉल्यूशंस इंजीनियर

Pascal AI Showcase Hero

Pascal AI, एआई पर आधारित ऑपरेटिंग सिस्टम है. इसे इन्वेस्टमेंट फ़ंड के लिए डिज़ाइन किया गया है. यह संस्थागत स्तर पर काम करता है. साथ ही, लाखों पेजों की फ़ाइलिंग, मेमो, और मॉडल को प्रोसेस करता है. इनका मकसद, किसी कंपनी के इंटरनल और एक्सटर्नल डेटा को एआई की मदद से बेहतर बनाना है. इससे एनालिस्ट और सीआईओ को डेटा के आधार पर तेज़ी से फ़ैसले लेने में मदद मिलती है.

Pascal AI को अपने एजेंटिक वर्कफ़्लो को बेहतर बनाने के लिए, एक ऐसे नॉलेज ग्राफ़ की ज़रूरत थी जो अलग-अलग तरह के मुश्किल फ़ाइनेंशियल दस्तावेज़ों को सटीक तरीके से स्ट्रक्चर्ड टेक्स्ट में बदल सके.

जटिल फ़ाइनेंशियल डेटा को पार्स करने की चुनौती

वित्तीय दस्तावेज़ों को प्रोग्राम के हिसाब से पार्स करने में, कई तरह की समस्याएं आती हैं. Gemini API को इंटिग्रेट करने से पहले, Pascal AI की टीम ने कई ओसीआर टूल और लार्ज लैंग्वेज मॉडल की जांच की. इस दौरान, उन्हें लगातार तकनीकी समस्याओं का सामना करना पड़ा:

  • जटिल विज़ुअल डेटा: मल्टी-ऐक्सिस चार्ट और ट्रेंड ग्राफ़ से सटीक डेटा निकालना आसान नहीं होता. अन्य मॉडल अक्सर ऐसी वैल्यू जनरेट करते हैं जो ओरिजनल विज़ुअल में मौजूद नहीं होती हैं. इससे, भरोसेमंद होने से जुड़ी समस्याएं पैदा होती हैं.
  • टेबल के जटिल स्ट्रक्चर: वित्तीय स्टेटमेंट में अक्सर मर्ज की गई सेल होती हैं. साथ ही, ये हॉरिज़ॉन्टल और वर्टिकल, दोनों तरह से कई पेजों पर फैली होती हैं. स्टैंडर्ड एक्सट्रैक्शन लाइब्रेरी, अक्सर इस स्ट्रक्चर को बनाए रखने में नाकाम रहती हैं. इससे, मुद्रा की इकाइयों या समयावधि जैसे ज़रूरी कॉन्टेक्स्ट की जानकारी नहीं मिल पाती.
  • दस्तावेज़ की क्वालिटी अलग-अलग होना: डेटा सोर्स में, डिजिटल फ़ाइलिंग से लेकर कम रिज़ॉल्यूशन वाले स्कैन किए गए PDF तक शामिल होते हैं. इससे पार्सिंग लॉजिक को समझना मुश्किल हो जाता है.


Pascal AI को एक ऐसी पार्सिंग लेयर की ज़रूरत थी जो बिना किसी भ्रम के इस जटिलता को हैंडल कर सके.

Gemini 2.5 Pro की मदद से, पहले से दो गुना ज़्यादा सटीक जवाब पाना

इन चुनौतियों से निपटने के लिए, Pascal AI ने LangChain के ज़रिए Gemini 2.5 Pro को इंटिग्रेट किया है. यह उनके दस्तावेज़ों से जुड़ी जानकारी के लिए मुख्य स्टैक के तौर पर काम करता है.

Pascal AI के एआई लीड कनव आनंद के मुताबिक, मॉडल की मल्टीमॉडल रीज़निंग की वजह से, जवाब ज़्यादा सटीक हो गए. पिछले समाधानों के उलट, Gemini 2.5 Pro में तथ्यों के ग़लत होने की समस्या कम होती है. साथ ही, यह मुश्किल ग्राफ़ और चार्ट को स्ट्रक्चर्ड मार्कडाउन टेबल में सटीक तरीके से बदलता है. इससे ज़रूरी वित्तीय कॉन्टेक्स्ट बना रहता है.

Pascal AI की परफ़ॉर्मेंस का आकलन करने के लिए, इंटरनल इवैलुएशन सेट का इस्तेमाल किया जाता है. इसमें एडिट डिस्टेंस एरर-रेट को ट्रैक किया जाता है. इससे यह पता चलता है कि पार्स किया गया आउटपुट, ओरिजनल टेक्स्ट से कितना मिलता-जुलता है. Gemini 2.5 Pro ने 4% एडिट डिस्टेंस एरर रेट हासिल किया. यह टेस्ट किए गए दूसरे सबसे अच्छे मॉडल की तुलना में, दो गुना ज़्यादा सटीक है. इसके अलावा, मॉडल ने हर एलिमेंट के हिसाब से 100% सटीकता हासिल की. साथ ही, टेबल, पैराग्राफ़, और हेडर जैसे स्ट्रक्चरल कॉम्पोनेंट की सही पहचान की.

प्रॉम्प्ट इंजीनियरिंग की मदद से, पार्सिंग लॉजिक को आसान बनाना

Gemini API की मदद से, न सिर्फ़ ज़्यादा सटीक जवाब मिले, बल्कि डेवलपमेंट की प्रोसेस भी तेज़ हुई. दस्तावेज़ से जुड़ी मुश्किल समस्याओं को हल करने के लिए, टीम कस्टम लॉजिक के बजाय मुख्य रूप से प्रॉम्प्ट इंजीनियरिंग का इस्तेमाल करती है. इससे, टीम नए दस्तावेज़ टाइप उपलब्ध होने पर, उन्हें तुरंत सपोर्ट कर सकती है.

आने वाले समय में, Pascal AI का लक्ष्य पार्सिंग की सटीकता को 100% के करीब पहुंचाना है. इसके लिए, वह बेहतर तरीकों का इस्तेमाल करेगा. इनमें मॉडल ऑर्केस्ट्रेशन और डोमेन के हिसाब से फ़ाइनेंशियल रिपोर्टिंग के लिए फ़ाइन-ट्यूनिंग शामिल है.

Gemini मॉडल का इस्तेमाल शुरू करने के लिए, हमारा एपीआई दस्तावेज़ पढ़ें.