Chia sẻ

Ngày 3 tháng 11 năm 2025

Xây dựng hệ thống thông tin tài chính có độ chính xác cao bằng Gemini 2.5 Pro

Mithun Madhusudan

Nhà sáng lập

Vishal Dharmadhikari

Kỹ sư giải pháp sản phẩm

Pascal AI showcase hero

Pascal AI là một hệ điều hành dựa trên AI được thiết kế cho các quỹ đầu tư, hoạt động ở quy mô tổ chức để xử lý hàng triệu trang tài liệu, bản ghi nhớ và mô hình. Sứ mệnh của họ là biến dữ liệu nội bộ và bên ngoài của một công ty thành lợi thế dựa trên AI, giúp các nhà phân tích và CIO đưa ra quyết định dựa trên dữ liệu một cách nhanh chóng hơn.

Để xây dựng biểu đồ tri thức hỗ trợ quy trình công việc theo hướng tác nhân, Pascal AI cần một hệ thống trí tuệ nhân tạo về tài liệu có khả năng chuyển đổi nhiều loại tài liệu tài chính phức tạp thành văn bản có cấu trúc với độ chính xác vượt trội.

Thách thức khi phân tích cú pháp dữ liệu tài chính phức tạp

Các tài liệu tài chính có những thách thức riêng và khó khăn trong việc phân tích cú pháp theo chương trình. Trước khi tích hợp Gemini API, nhóm AI của Pascal đã thử nghiệm nhiều công cụ OCR và mô hình ngôn ngữ lớn, nhưng gặp phải những trở ngại kỹ thuật dai dẳng:

  • Dữ liệu trực quan phức tạp: Việc trích xuất dữ liệu chính xác từ biểu đồ nhiều trục và biểu đồ xu hướng là một việc không hề đơn giản. Các mô hình khác thường tạo ra các giá trị ảo không có trong hình ảnh gốc, gây ra các vấn đề về độ tin cậy không thể chấp nhận được.
  • Cấu trúc bảng phức tạp: Báo cáo tài chính thường có các ô được hợp nhất và trải dài trên nhiều trang theo cả chiều ngang và chiều dọc. Các thư viện trích xuất tiêu chuẩn thường không giữ được cấu trúc này, làm mất ngữ cảnh quan trọng như đơn vị tiền tệ hoặc khoảng thời gian.
  • Chất lượng tài liệu đa dạng: Nguồn dữ liệu có nhiều loại, từ tệp được tạo bằng kỹ thuật số cho đến tệp PDF được quét có độ phân giải thấp, khiến logic phân tích cú pháp cứng nhắc trở nên dễ bị lỗi.


Pascal AI cần một lớp phân tích cú pháp có thể xử lý sự phức tạp này mà không bị ảo giác.

Đạt được độ chính xác cao gấp 2 lần nhờ Gemini 2.5 Pro

Để khắc phục những thách thức này, Pascal AI đã tích hợp Gemini 2.5 Pro thông qua LangChain làm cốt lõi của ngăn xếp trí tuệ tài liệu.

Theo Kanav Anand, Trưởng nhóm AI tại Pascal AI, khả năng suy luận đa phương thức của mô hình này đã giúp tăng đáng kể độ chính xác. Không giống như các giải pháp trước đây, Gemini 2.5 Pro giảm thiểu hiện tượng ảo giác và chuyển đổi chính xác các biểu đồ phức tạp thành bảng markdown có cấu trúc, đồng thời giữ nguyên bối cảnh tài chính quan trọng.

Để đo lường mức độ thành công, Pascal AI sử dụng một bộ đánh giá nội bộ, theo dõi tỷ lệ lỗi khoảng cách chỉnh sửa để xác định mức độ gần của đầu ra được phân tích với văn bản gốc. Gemini 2.5 Pro đạt tỷ lệ lỗi khoảng cách chỉnh sửa thấp là 4% , hoạt động chính xác gấp 2 lần so với mô hình tốt nhất tiếp theo được thử nghiệm. Hơn nữa, mô hình này đạt được độ chính xác 100% theo từng phần tử, xác định chính xác các thành phần cấu trúc như bảng, đoạn văn và tiêu đề.

Đơn giản hoá logic phân tích cú pháp bằng kỹ thuật tạo câu lệnh

Ngoài độ chính xác thô, Gemini API còn giúp cải thiện tốc độ phát triển. Bằng cách giải quyết các vấn đề phức tạp về trí tuệ tài liệu chủ yếu thông qua kỹ thuật tạo câu lệnh thay vì logic tuỳ chỉnh dễ bị lỗi, nhóm có thể nhanh chóng lặp lại để hỗ trợ các loại tài liệu mới khi chúng có sẵn.

Trong tương lai, Pascal AI đặt mục tiêu đạt được độ chính xác gần như 100% trong việc phân tích cú pháp bằng cách thử nghiệm các phương pháp nâng cao, bao gồm cả việc điều phối mô hình và tinh chỉnh để báo cáo tài chính theo từng lĩnh vực cụ thể.

Để bắt đầu tạo ứng dụng bằng các mô hình Gemini, hãy đọc tài liệu về API của chúng tôi.