PDF 压缩应用

将图书更改为简易英语版本(不含其流程)

作用

我的应用可简化 PDF 图书中的难懂文字,让非英语母语人士更轻松地阅读。该应用旨在帮助用户将难懂的字词和句子拆解成更简单的英语,从而帮助用户理解复杂的语言并提高词汇量。

运作方式如下:

1. 文本提取:该应用使用 Tesseract OCR 从 PDF 文件中提取文本。这样,它就可以处理扫描或图片格式的图书。

2. 简化文本:该应用的核心功能涉及使用 Google Gemini API。提取文本后,应用会将其发送到 Gemini API,后者会重写复杂的句子并识别难词。

3. 替换和输出:应用使用正则表达式提取难词并将其替换为 API 提供的更简单的定义。用户可以选择两种模式:初级和中级。“初学者”模式会更彻底地简化文本,而“中级”模式则会提供更具挑战性的词汇,帮助用户逐步提升英语水平。

4. 结果:最后,该应用会生成一个包含简化内容的文本文件,使其更易于阅读和理解。对于在阅读高级英语文本时遇到困难的学习者来说,这项功能非常有用。

通过集成 Gemini API,该应用不仅简化了语言,还可根据用户的英语熟练程度量身定制学习体验。

可采用以下设备打造

  • Python Streamlit

团队

更新者

White Rock

发件人

印度