ỨNG DỤNG PDF MINIMALIZER
THAY ĐỔI SÁCH THÀNH BẢN TIẾNG ANH DỄ HIỂU (không có luồng)
Ý nghĩa
Ứng dụng của tôi đơn giản hoá văn bản khó hiểu trong sách PDF, giúp người không nói tiếng Anh bản địa dễ đọc hơn. Ứng dụng này được thiết kế để giúp người dùng hiểu được ngôn ngữ phức tạp và cải thiện vốn từ vựng bằng cách chia nhỏ các từ và câu khó thành tiếng Anh đơn giản hơn.
Sau đây là cách hoạt động của ứng dụng:
1.Trích xuất văn bản: Ứng dụng sử dụng Tesseract OCR để trích xuất văn bản từ tệp PDF. Điều này cho phép ứng dụng xử lý sách ở định dạng quét hoặc hình ảnh.
2.Đơn giản hoá văn bản: Tính năng cốt lõi của ứng dụng này là sử dụng API Google Gemini. Sau khi trích xuất văn bản, ứng dụng sẽ gửi văn bản đó đến Gemini API. API này sẽ diễn đạt lại các câu phức tạp và xác định các từ khó.
3.Thay thế và đầu ra: Ứng dụng sử dụng biểu thức chính quy để trích xuất và thay thế các từ khó bằng các định nghĩa đơn giản hơn do API cung cấp. Người dùng có thể chọn giữa hai chế độ: Người mới bắt đầu và Người chơi trung cấp. Chế độ Người mới bắt đầu đơn giản hoá văn bản kỹ lưỡng hơn, trong khi Chế độ Trung cấp cung cấp từ vựng khó hơn để giúp người dùng từng bước cải thiện kỹ năng tiếng Anh của họ.
4.Kết quả: Cuối cùng, ứng dụng sẽ tạo một tệp văn bản chứa nội dung được đơn giản hoá, giúp người dùng dễ đọc và dễ hiểu hơn. Kết quả này có thể là một công cụ có giá trị cho những người học gặp khó khăn với văn bản tiếng Anh nâng cao.
Bằng cách tích hợp API Gemini, ứng dụng không chỉ đơn giản hoá ngôn ngữ mà còn tuỳ chỉnh trải nghiệm học tập dựa trên trình độ tiếng Anh của người dùng.
Được tạo bằng
- python streamlit
Nhóm
Người cập nhật
White Rock
Từ
Ấn Độ