PDF 圧縮アプリ

書籍を簡単な英語版に変更する(フローなし)

機能

私のアプリは、PDF 書籍の難しいテキストを簡素化して、英語を母国語としないユーザーが読みやすくしています。このアプリは、難しい単語や文章をより簡単な英語に分解することで、複雑な言語を理解し、語彙力を向上させるために設計されています。

仕組みは次のとおりです。

1. テキストの抽出: このアプリは Tesseract OCR を使用して、PDF ファイルからテキストを抽出します。これにより、スキャンされた書籍や画像形式の書籍を処理できます。

2. テキストの簡素化: このアプリのコア機能には、Google Gemini API が使用されています。テキストを抽出した後、アプリはそれを Gemini API に送信します。Gemini API は複雑な文を言い換え、難しい単語を特定します。

3. 置換と出力: アプリは正規表現を使用して難しい単語を抽出し、API から提供された簡単な定義に置き換えます。初級と中級の 2 つのモードから選択できます。初級モードではテキストがより徹底的に簡素化され、中級モードではより難しい語彙が使用されるため、ユーザーは英語のスキルを徐々に向上させることができます。

4. 結果: 最後に、アプリは簡素化されたコンテンツを含むテキスト ファイルを生成し、読みやすく理解しやすいものにします。この出力は、高度な英語のテキストに苦労している学習者にとって有用なツールになります。

Gemini API を統合することで、アプリは言語を簡素化するだけでなく、ユーザーの英語習熟度に基づいて学習体験をカスタマイズします。

構成

  • python streamlit

チーム

By

White Rock

差出人

インド