แชร์

3 พ.ย. 2025

การสร้างระบบอัจฉริยะสำหรับเอกสารทางการเงินที่มีความแม่นยำสูงด้วย Gemini 2.5 Pro

Mithun Madhusudan

ผู้ก่อตั้ง

Vishal Dharmadhikari

วิศวกรโซลูชันผลิตภัณฑ์

Pascal AI showcase hero

Pascal AI คือระบบปฏิบัติการที่สร้างขึ้นโดยใช้ AI ซึ่งออกแบบมาสำหรับกองทุนรวมที่ดำเนินการในระดับสถาบันเพื่อประมวลผลเอกสารที่ยื่น บันทึก และโมเดลหลายล้านหน้า โดยมีพันธกิจในการเปลี่ยนข้อมูลภายในและภายนอกของบริษัทให้เป็นข้อได้เปรียบที่ทำงานด้วยระบบ AI ซึ่งช่วยให้นักวิเคราะห์และ CIO ตัดสินใจจากข้อมูลได้รวดเร็วยิ่งขึ้น

Pascal AI ต้องการระบบอัจฉริยะในเอกสารที่สามารถแปลงเอกสารทางการเงินที่ซับซ้อนและหลากหลายให้เป็นข้อความที่มีโครงสร้างได้อย่างแม่นยำเพื่อสร้างกราฟความรู้ที่ขับเคลื่อนเวิร์กโฟลว์แบบเป็น Agent

ความท้าทายในการแยกวิเคราะห์ข้อมูลทางการเงินที่ซับซ้อน

เอกสารทางการเงินเป็นเอกสารที่มีความท้าทายเฉพาะตัวและยากต่อการแยกวิเคราะห์โดยใช้โปรแกรม ก่อนที่จะผสานรวม Gemini API ทีม Pascal AI ได้ทดสอบเครื่องมือ OCR และโมเดลภาษาขนาดใหญ่ต่างๆ และพบอุปสรรคทางเทคนิคที่เกิดขึ้นอย่างต่อเนื่อง ดังนี้

  • ข้อมูลภาพที่ซับซ้อน: การดึงข้อมูลที่ถูกต้องจากแผนภูมิหลายแกนและกราฟแนวโน้มไม่ใช่เรื่องง่าย โมเดลอื่นๆ มักจะสร้างค่าที่ไม่ถูกต้องซึ่งไม่มีอยู่ในภาพต้นฉบับ ทำให้เกิดปัญหาความน่าเชื่อถือที่ยอมรับไม่ได้
  • โครงสร้างตารางที่ซับซ้อน: งบการเงินมักจะมีเซลล์ที่ผสานกันและครอบคลุมหลายหน้าทั้งในแนวนอนและแนวตั้ง ไลบรารีการแยกข้อมูลมาตรฐานมักไม่สามารถรักษาโครงสร้างนี้ไว้ได้ ทำให้สูญเสียบริบทที่สำคัญ เช่น หน่วยสกุลเงินหรือระยะเวลา
  • คุณภาพของเอกสารที่หลากหลาย: แหล่งข้อมูลมีตั้งแต่การยื่นเอกสารแบบดิจิทัลไปจนถึง PDF ที่สแกนแล้วซึ่งมีความละเอียดต่ำ ทำให้ตรรกะการแยกวิเคราะห์ที่เข้มงวดมีความเปราะบาง


Pascal AI ต้องมีเลเยอร์การแยกวิเคราะห์ที่สามารถจัดการความซับซ้อนนี้ได้โดยไม่เกิดอาการหลอน

มีความแม่นยำมากขึ้น 2 เท่าด้วย Gemini 2.5 Pro

Pascal AI จึงผสานรวม Gemini 2.5 Pro ผ่าน LangChain เพื่อเป็นแกนหลักของชุดเครื่องมืออัจฉริยะด้านเอกสารเพื่อเอาชนะความท้าทายเหล่านี้

Kanav Anand หัวหน้าทีม AI ที่ Pascal AI กล่าวว่าการให้เหตุผลแบบมัลติโมดัลของโมเดลช่วยเพิ่มความแม่นยำได้อย่างมาก Gemini 2.5 Pro ลดการเกิดอาการหลอนและแปลงกราฟและแผนภูมิที่ซับซ้อนเป็นตาราง Markdown ที่มีโครงสร้างได้อย่างแม่นยำ พร้อมทั้งรักษาบริบททางการเงินที่สำคัญไว้ ซึ่งแตกต่างจากโซลูชันก่อนหน้านี้

Pascal AI ใช้ชุดการประเมินภายในเพื่อวัดความสำเร็จ โดยจะติดตามอัตราข้อผิดพลาดของระยะทางในการแก้ไขเพื่อพิจารณาว่าเอาต์พุตที่แยกวิเคราะห์แล้วอยู่ใกล้กับข้อความต้นฉบับมากน้อยเพียงใด Gemini 2.5 Pro มีอัตราข้อผิดพลาดในการแก้ไขต่ำที่ 4% ซึ่งทำงานได้แม่นยำกว่าโมเดลที่ดีที่สุดรองลงมาที่ทดสอบถึง 2 เท่า นอกจากนี้ โมเดลยังมีความแม่นยำระดับองค์ประกอบ 100% โดยระบุคอมโพเนนต์โครงสร้าง เช่น ตาราง ย่อหน้า และส่วนหัว ได้อย่างถูกต้อง

ลดความซับซ้อนของตรรกะการแยกวิเคราะห์ด้วยการออกแบบพรอมต์

นอกเหนือจากความแม่นยำดิบแล้ว Gemini API ยังช่วยเพิ่มความเร็วในการพัฒนาด้วย การแก้ปัญหาที่ซับซ้อนด้านการวิเคราะห์เอกสารโดยหลักๆ ผ่านการออกแบบพรอมต์แทนที่จะใช้ตรรกะที่กำหนดเองซึ่งมีความเปราะบางช่วยให้ทีมสามารถทำซ้ำได้อย่างรวดเร็วเพื่อรองรับเอกสารประเภทใหม่ๆ เมื่อพร้อมใช้งาน

ในอนาคต Pascal AI ตั้งเป้าที่จะเพิ่มความแม่นยำในการแยกวิเคราะห์ให้ใกล้เคียง 100% โดยการทดลองใช้วิธีการขั้นสูง ซึ่งรวมถึงการจัดระเบียบโมเดลและการปรับแต่งสำหรับการรายงานทางการเงินเฉพาะโดเมน

หากต้องการเริ่มสร้างด้วยโมเดล Gemini โปรดอ่านเอกสารประกอบเกี่ยวกับ API