普通的工作中,有许多简单、重复、琐碎的工作。大家的平均电脑水平不高。工作中有一些繁琐的工作例如拍照片,整理照片中的文字,收集手填的表格,整理成为电子表格。这些工作耗时费力。网上自动化办公已经流行多年,大多是教人如何使用python的定制化库。即使python已经很容易上手,但是对于普通人来讲,他们并没有时间、精力、能力来学习编程。因此如果能将这两类问题自动化,人们只是来做审核,会节省他们大量的宝贵时间。
启动: conda activate easy_office
paddle ocr 环境: conda activate paddle_env
images的图片均来源于paddleocr与easyocr仓库。
表格识别参考:https://www.pythonheidong.com/blog/article/1206744/e1b4ca293bb92e27f681/
文档识别参考:https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/doc/doc_ch/multi_languages.md