Skip to content

基于Pytorch的OCR工具库,支持常用的文字检测和识别算法

Notifications You must be signed in to change notification settings

ttthomaschan/PytorchOCR

 
 

Repository files navigation

PytorchOCR

简介

PytorchOCR旨在打造一套训练,推理,部署一体的OCR引擎库

添加微信z572459439或者nsnovio,然后进群讨论。备注ocr进群。

更新日志

  • 2021.02.27 添加移动端识别模型文件、移动端DBNet模型文件
  • 2021.02.25 添加服务器端识别模型文件
  • 2021.02.09 添加DBNet模型,修改DBNet网络结构的fpn,inference时候的缩放及后处理
  • 2020.07.01 添加 添加新算法文档
  • 2020.06.29 添加检测的mb3和resnet50_vd预训练模型
  • 2020.06.25 检测模块的训练和预测ok
  • 2020.06.18 更新README
  • 2020.06.17 识别模块的训练和预测ok

todo list

  • crnn训练与python版预测
  • DB训练与python版预测
  • imagenet预训练模型
  • 服务器端识别模型文件
  • DB通用模型
  • 手机端部署
  • With Triton

环境配置

需要的环境如下

  • pytorch 1.4+
  • torchvision 0.5+
  • gcc 4.9+ (pse,pan会用到)

快速安装环境

pip3 install -r requirements.txt

文档教程

文本检测算法

PytorchOCR开源的文本检测算法列表:

模型简介 骨干网络 推荐场景 大小 下载链接
预训练模型 ResNet50 服务器端 97.3M 3cmz
原始超轻量模型,支持中英文、多语种文本检测 MoblieNet 移动端 2.3M c9ko
通用模型,支持中英文、多语种文本检测,比超轻量模型更大,但效果更好 ResNet18 服务器端 47.2M r26k

文本识别算法

PytorchOCR开源的文本识别算法列表:

模型简介 骨干网络 推荐场景 大小 下载链接
原始超轻量模型,支持中英文、数字识别 MoblieNet 移动端 4.2M 7x9q
通用模型,支持中英文、数字识别 ResNet34 服务器端 106.4M sdnc

结果展示

检测

检测

贡献代码

我们非常欢迎你为PytorchOCR贡献代码,也十分感谢你的反馈。

相关仓库

About

基于Pytorch的OCR工具库,支持常用的文字检测和识别算法

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 62.1%
  • Python 37.9%