PDF MINIMALIZER APP
책을 쉬운 영어 버전으로 변경 (흐름 제외)
기능
내 앱은 PDF 도서의 어려운 텍스트를 단순화하여 영어가 모국어가 아닌 사용자가 더 쉽게 읽을 수 있도록 합니다. 이 앱은 어려운 단어와 문장을 더 간단한 영어로 분류하여 사용자가 복잡한 언어를 이해하고 어휘력을 향상할 수 있도록 설계되었습니다.
작동 방식은 다음과 같습니다.
1. 텍스트 추출: 앱은 Tesseract OCR을 사용하여 PDF 파일에서 텍스트를 추출합니다. 이를 통해 스캔된 형식 또는 이미지 형식의 책을 처리할 수 있습니다.
2.텍스트 단순화: 앱의 핵심 기능은 Google Gemini API를 사용하는 것입니다. 텍스트를 추출한 후 앱은 Gemini API로 전송하여 복잡한 문장을 재구성하고 어려운 단어를 식별합니다.
3.대체 및 출력: 앱은 정규식을 사용하여 어려운 단어를 추출하고 API에서 제공하는 더 간단한 정의로 대체합니다. 사용자는 초보자와 중급자 모드 중에서 선택할 수 있습니다. 초보자 모드는 텍스트를 더 철저하게 단순화하는 반면 중급 모드는 사용자가 영어 실력을 점진적으로 향상할 수 있도록 더 어려운 어휘를 제공합니다.
4.결과: 마지막으로 앱은 간소화된 콘텐츠가 포함된 텍스트 파일을 생성하여 더 쉽게 읽고 이해할 수 있도록 합니다. 이 출력물은 고급 영어 텍스트에 어려움을 겪는 학습자에게 유용한 도구가 될 수 있습니다.
Gemini API를 통합함으로써 앱은 언어를 단순화할 뿐만 아니라 사용자의 영어 실력 수준에 따라 학습 환경을 맞춤설정합니다.
구성용 제품
- python streamlit
팀
작성자:
White Rock
From
인도