শেয়ার করুন

৩ নভেম্বর, ২০২৫

জেমিনি ২.৫ প্রো দিয়ে একটি উচ্চ-নির্ভুলতা আর্থিক নথি গোয়েন্দা ব্যবস্থা তৈরি করা

মিঠুন মধুসূদন

প্রতিষ্ঠাতা

বিশাল ধর্মাধিকারী

পণ্য সমাধান প্রকৌশলী

প্যাসকেল এআই শোকেস হিরো

প্যাসকেল এআই হল একটি এআই-নেটিভ অপারেটিং সিস্টেম যা বিনিয়োগ তহবিলের জন্য ডিজাইন করা হয়েছে, যা লক্ষ লক্ষ পৃষ্ঠার ফাইলিং, মেমো এবং মডেল প্রক্রিয়া করার জন্য প্রাতিষ্ঠানিক স্কেলে কাজ করে। তাদের লক্ষ্য হল একটি ফার্মের অভ্যন্তরীণ এবং বাহ্যিক ডেটাকে এআই-চালিত সুবিধায় রূপান্তর করা, যা বিশ্লেষক এবং সিআইওদের দ্রুত, ডেটা-চালিত সিদ্ধান্ত নিতে সহায়তা করে।

তাদের এজেন্টিক কর্মপ্রবাহকে শক্তিশালী করে এমন জ্ঞান গ্রাফ তৈরি করতে, প্যাসকেল এআই-এর একটি ডকুমেন্ট ইন্টেলিজেন্স সিস্টেমের প্রয়োজন ছিল যা ব্যতিক্রমী নির্ভুলতার সাথে বিভিন্ন, জটিল আর্থিক নথিগুলিকে কাঠামোগত পাঠ্যে রূপান্তর করতে সক্ষম।

জটিল আর্থিক তথ্য বিশ্লেষণের চ্যালেঞ্জ

আর্থিক নথিগুলি প্রোগ্রাম্যাটিক পার্সিংয়ের জন্য অনন্য, একগুঁয়ে চ্যালেঞ্জ উপস্থাপন করে। জেমিনি এপিআই সংহত করার আগে, প্যাসকেল এআই টিম বিভিন্ন ওসিআর সরঞ্জাম এবং বৃহৎ ভাষা মডেল পরীক্ষা করেছিল, ক্রমাগত প্রযুক্তিগত বাধার সম্মুখীন হয়েছিল:

  • জটিল ভিজ্যুয়াল ডেটা: মাল্টি-অ্যাক্সিস চার্ট এবং ট্রেন্ড গ্রাফ থেকে সঠিক ডেটা বের করা তুচ্ছ নয়। অন্যান্য মডেলগুলি প্রায়শই মূল ভিজ্যুয়ালগুলিতে উপস্থিত না থাকা মানগুলিকে হ্যালুসিনেটেড করে, যা অগ্রহণযোগ্য নির্ভরযোগ্যতার সমস্যা তৈরি করে।
  • জটিল টেবিল কাঠামো: আর্থিক বিবৃতিতে প্রায়শই একত্রিত কোষ থাকে এবং অনুভূমিক এবং উল্লম্বভাবে একাধিক পৃষ্ঠা বিস্তৃত থাকে। স্ট্যান্ডার্ড এক্সট্রাকশন লাইব্রেরিগুলি প্রায়শই এই কাঠামোটি সংরক্ষণ করতে ব্যর্থ হয়, মুদ্রা ইউনিট বা সময়কালগুলির মতো গুরুত্বপূর্ণ প্রসঙ্গ হারায়।
  • বিভিন্ন ধরণের ডকুমেন্টের মান: ডেটা উৎসের মধ্যে রয়েছে ডিজিটাল-নেটিভ ফাইলিং থেকে শুরু করে কম-রেজোলিউশনের, স্ক্যান করা PDF, যা অনমনীয় পার্সিং লজিককে ভঙ্গুর করে তোলে।


প্যাসকেল এআই-এর জন্য এমন একটি পার্সিং লেয়ারের প্রয়োজন ছিল যা হ্যালুসিনেশন ছাড়াই এই জটিলতা মোকাবেলা করতে পারে।

জেমিনি ২.৫ প্রো ব্যবহার করে ২ গুণ বেশি নির্ভুলতা অর্জন করা

এই চ্যালেঞ্জগুলি কাটিয়ে ওঠার জন্য, প্যাসকেল এআই তাদের ডকুমেন্ট ইন্টেলিজেন্স স্ট্যাকের মূল অংশ হিসেবে ল্যাংচেইনের মাধ্যমে জেমিনি ২.৫ প্রোকে একীভূত করেছে।

প্যাসকেল এআই-এর এআই লিড কানভ আনন্দের মতে, মডেলের মাল্টিমোডাল যুক্তি উল্লেখযোগ্যভাবে নির্ভুলতা বৃদ্ধি করেছে। পূর্ববর্তী সমাধানগুলির বিপরীতে, জেমিনি ২.৫ প্রো হ্যালুসিনেশন কমিয়ে দেয় এবং জটিল গ্রাফ এবং চার্টগুলিকে সঠিকভাবে কাঠামোগত মার্কডাউন টেবিলে রূপান্তরিত করে, গুরুত্বপূর্ণ আর্থিক প্রেক্ষাপট সংরক্ষণ করে।

সাফল্য পরিমাপ করার জন্য, Pascal AI একটি অভ্যন্তরীণ মূল্যায়ন সেট ব্যবহার করে, যা সম্পাদনা দূরত্ব ত্রুটি-হার ট্র্যাকিং করে পার্স করা আউটপুট মূল পাঠ্যের কতটা কাছাকাছি তা নির্ধারণ করে। Gemini 2.5 Pro কম 4% সম্পাদনা দূরত্ব ত্রুটি হার অর্জন করেছে, পরীক্ষিত পরবর্তী সেরা মডেলের তুলনায় 2 গুণ বেশি নির্ভুলভাবে পারফর্ম করেছে। তদুপরি, মডেলটি 100% উপাদান-ভিত্তিক নির্ভুলতা অর্জন করেছে, টেবিল, অনুচ্ছেদ এবং শিরোনামের মতো কাঠামোগত উপাদানগুলিকে সঠিকভাবে সনাক্ত করেছে।

প্রম্পট ইঞ্জিনিয়ারিং ব্যবহার করে যুক্তি বিশ্লেষণ সহজীকরণ

অ-নির্ভুলতার বাইরে, জেমিনি এপিআই উন্নয়নের গতি উন্নত করেছে। ভঙ্গুর কাস্টম লজিকের পরিবর্তে প্রম্পট ইঞ্জিনিয়ারিংয়ের মাধ্যমে প্রাথমিকভাবে জটিল ডকুমেন্ট ইন্টেলিজেন্স সমস্যাগুলি সমাধান করে, দলটি নতুন ডকুমেন্ট প্রকারগুলি উপলব্ধ হওয়ার সাথে সাথে সমর্থন করার জন্য দ্রুত পুনরাবৃত্তি করতে পারে।

সামনের দিকে তাকালে, প্যাসকেল এআই লক্ষ্য রাখে ডোমেন-নির্দিষ্ট আর্থিক প্রতিবেদনের জন্য মডেল অর্কেস্ট্রেশন এবং ফাইন-টিউনিং সহ উন্নত পদ্ধতিগুলি পরীক্ষা করে প্রায় ১০০% পার্সিং নির্ভুলতার দিকে এগিয়ে যাওয়া।

জেমিনি মডেল দিয়ে তৈরি শুরু করতে, আমাদের API ডকুমেন্টেশন পড়ুন।

ক্যালক্যাম

ক্যালক্যাম এবং জেমিনি ২.০ ফ্ল্যাশের সাহায্যে দ্রুত, নির্ভুল পুষ্টি বিশ্লেষণ