PDF 圧縮アプリ
書籍を簡単な英語版に変更する(フローなし)
機能
私のアプリは、PDF 書籍の難しいテキストを簡素化して、英語を母国語としないユーザーが読みやすくしています。このアプリは、難しい単語や文章をより簡単な英語に分解することで、複雑な言語を理解し、語彙力を向上させるために設計されています。
仕組みは次のとおりです。
1. テキストの抽出: このアプリは Tesseract OCR を使用して、PDF ファイルからテキストを抽出します。これにより、スキャンされた書籍や画像形式の書籍を処理できます。
2. テキストの簡素化: このアプリのコア機能には、Google Gemini API が使用されています。テキストを抽出した後、アプリはそれを Gemini API に送信します。Gemini API は複雑な文を言い換え、難しい単語を特定します。
3. 置換と出力: アプリは正規表現を使用して難しい単語を抽出し、API から提供された簡単な定義に置き換えます。初級と中級の 2 つのモードから選択できます。初級モードではテキストがより徹底的に簡素化され、中級モードではより難しい語彙が使用されるため、ユーザーは英語のスキルを徐々に向上させることができます。
4. 結果: 最後に、アプリは簡素化されたコンテンツを含むテキスト ファイルを生成し、読みやすく理解しやすいものにします。この出力は、高度な英語のテキストに苦労している学習者にとって有用なツールになります。
Gemini API を統合することで、アプリは言語を簡素化するだけでなく、ユーザーの英語習熟度に基づいて学習体験をカスタマイズします。
構成
- python streamlit
チーム
By
White Rock
差出人
インド