Skip to content

Releases: bandtom/Umi-OCR

Umi-OCR v2.1.3

25 Aug 08:05
11fd6c2
Compare
Choose a tag to compare

v2.1.3 主要更新:

  • 新推出 Linux (Debian) 平台版本。
  • 支持:Docker 部署
  • 新增:HTTP 文档识别接口。👉 文档
  • 修复:文档中宽高为0的异常图片会导致任务卡住。

bate.1 版本之后的更新:

  • 修复:HTTP文档识别接口上传的文件名含非ascii字符时,该字符可被保留。
  • 优化:HTTP文档识别接口的 Python示例Html示例 代码。
  • 优化:排版解析的 单栏-单行 方案,对于间隔较大的两个相邻文本块,会添加空格作为间隔符。

Windows7 和 Linux 用户注意: 常见问题及修复方法


Windows 下载

不同版本仅OCR引擎插件不同,其它功能完全一致,附带多国语言识别库。.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU

重要提示:如果执行OCR时报错 0xc0000142[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。

Umi-OCR_Paddle_v2.1.3.7z.exe (134MB)
SHA256: 27f5eb5097ba8fe95bf8247cb186c9c8518f6c8268b4f5d828e2e80b9e40be34

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

Umi-OCR_Rapid_v2.1.3.7z.exe (97MB)
SHA256: de945941f785b9bbf6c7c5d82a5736c9b14a777d3503966c5ea110ac21ebc816

Linux 下载

Umi-OCR_Debian_x64_Paddle_2.1.3.tar.xz (273MB)
SHA256: 6d9596eaf482d4a37452bf8e960586fc66605d9c96047927270128a0a3a416fd

此发行版在 Ubuntu 22.04 / Debian 12.5 / Kali 2023.3 桌面环境中通过测试。由于 Linux 平台的多样化,发行版不一定能在所有环境中正常运行。如果遇到问题,可参考 常见问题及修复方法 ,或根据报错安装缺失的依赖库。欢迎提 Issue 共同讨论解决方法。有能力的用户可尝试 从源码部署 Umi-OCR ,以得到最好的兼容性。

首次运行请在命令行中执行 ./umi-ocr.sh ,随后可在全局设置中创建桌面/开始菜单快捷方式,便于日常使用。

Umi-OCR v2.1.1

04 May 11:24
Compare
Choose a tag to compare

两周年 & 两万星星撒花!

Celebrating the two-year anniversary of this project and reaching 20k stars!

作者的话

v2.1.1 主要更新 / Changelog

  • 修复:Windows7核心数<=2的CPU 无法进行文档识别的Bug。
  • 新增:批量文档识别允许指定忽略区域的页数范围。
  • 新增:命令行--path允许传入多个图片或文件夹。👉命令行手册
  • 新增:新的命令行、HTTP接口:识别/生成二维码图像。👉HTTP手册
  • 优化:双栏面板会记忆左右折叠状态。
  • 完善 繁+英+日 界面本地化翻译。感谢 翻译人员
次要更新:(点击展开)

Windows7 用户注意: 常见问题及修复方法


配置文件迁移 / Configuration file migration

Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

Copy the UmiOCR-data/.settings from the old version of the software to the same location in the new version.

下载说明 / Download Instructions

不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。

.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU

重要提示:如果执行OCR时报错 0xc0000142[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。

Umi-OCR_Paddle_v2.1.0.7z.exe (129MB)
SHA256: 53e144b07c3ddfc1038e16926912de75c8212840c84cd56713f9e93ecc22e753

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

Umi-OCR_Rapid_v2.1.0.7z.exe (97.1MB)
SHA256: 09f10d04bd1915ad67a76e57e54adad781a295e8bbf64c7a3e7207f056cafee6

更多插件 / Plugins

前往 Umi-OCR_插件仓库 ,下载更多OCR插件,获取离线数学公式识别等附加功能。

Visit the Umi-OCR_Plugins to download more OCR plugins and acquire additional features such as Offline Mathematical Formula Recognition.


更多下载途径: 蓝奏云 | SourceForge | Scoop

Download Umi-OCR

release/2.1.0

07 Mar 14:00
Compare
Choose a tag to compare

重大更新:

  • 批量文档识别。支持 pdf, epub, mobi 等多种格式的文档,对扫描件进行OCR或提取原有文本。可输出为 双层可搜索PDF
  • 更强大的 排版解析 功能,代替之前的段落合并。基于 间隙树排序算法 ,解析多栏布局图片与文档时有较好的精度。
  • HTTP接口参数作出了部分改动,并提供了一些更方便的选项。有需要的用户请重新参考 README_HTTP.md

⚠ Windows 7 用户注意:

文档识别可能在Win7上出现异常,如无法保存PDF文件、软件崩溃等。已知系统驱动、运行库不齐全的系统更有可能出现该问题。具体原因尚在调查中。
如果您发现了上述问题,请尝试安装常用运行库,并更新系统补丁到最新。或者,换用Win10及以上的系统进行文档识别
其他功能在Win7上不受影响。

其它更新内容:

  • 新增:允许隐藏托盘图标。 (#338)
  • 新增:重复上一次截图区域的快捷键。 (#357)
  • 新增:用本地图片浏览器打开图片的快捷按钮。 (#335)
  • 修复:避免系统环境变量QMLSCENE_DEVICE的影响。 (#270)
  • 修复一些小问题,优化一些UI表现与提示语。

img

Help us translate / 帮助我们翻译!

We warmly invite translators to join us in our project's localization efforts!
You can review existing translations or contribute new ones.
Please visit the online platform Weblate at:
https://hosted.weblate.org/engage/umi-ocr/

配置文件迁移

Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

下载说明

不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。

.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU

重要提示:如果执行OCR时报错[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。

Umi-OCR_Paddle_v2.1.0.7z.exe (128MB)
SHA256: 5349728289f353a25b5f570fe11795bb60d80c1df419bcc9977899b6c1c723a6

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

Umi-OCR_Rapid_v2.1.0.7z.exe (97MB)
SHA256: 6460148b3b8fcdfb447ed8984a9c2fa232ca0cd156d8352f47d1841b2e3614ac

更多插件

前往 Umi-OCR_插件仓库 ,下载更多OCR插件,获取离线数学公式识别等附加功能。

Download Umi-OCR

Umi-OCR v2.0.1

12 Dec 11:23
Compare
Choose a tag to compare

v2.0.1 更新内容:

  • 【HTTP接口用户注意】 重新设计了HTTP接口。允许省略参数,允许设定段落合并。见HTTP使用手册
  • 命令行增加指令-->-->>,将结果输出到文件。见命令行使用手册
  • 优化:调整图像数据的内部编码,减少英文空格丢失的几率。
  • 优化:调整部分UI文本和布局。
  • 优化:csv默认保存为ansi编码,以兼容Office Excel。 (#237)
  • 优化:Rapid插件移除了旧的简中-v3语言库,默认使用v4版。
  • 修复:开启“禁用美化效果”后,外部通知弹窗无法关闭。 (#234)
  • 修复:别的程序通过命令行调用Umi-OCR时,无法获取stdout输出。

配置文件迁移

v2.0.0 用户升级时,将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

下载说明

不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。

.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU

重要提示:如果执行OCR时报错[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。

Umi-OCR_Paddle_v2.0.1.7z.exe (118MB)
SHA256: cb51be5c37f69ef6a4a5288c591051d240cf233929daff233a6e957c5eea600d

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

Umi-OCR_Rapid_v2.0.1.7z.exe (86MB)
SHA256: b2e316ff3386ae9b62d45aefa5bc4a7e23319a61f64c4d3ccf37dee4d5af666f

额外:数学公式识别插件

测试中,详见这里

Umi-OCR 文字识别工具 v1.3.7

12 Oct 02:08
Compare
Choose a tag to compare

公告:v2.0.0 预览版 开放测试!

开发重心转向v2,v1.x 版本可能将逐步停止维护。

测试阶段的 v2 可能含Bug。注重稳定的用户可继续使用 v1.3 版本。


v1.3.7 主要更新:

  • 兼容 Win7 x64 。
  • (若 Win7 报错计算机中丢失 VCOMP140.DLL ,请安装 VC运行库

感谢 @vector090 提供的协助

文件说明:

软件本体:Umi-OCR.v1.3.7.7z(67.3 MB),内置简体中文&英文通用识别库。

  • SHA256: 8aff9198a5c1328c986fd13d9c17491727e994908f722cdea661dfcc01970587

软件(多国语言整合版):Umi-OCR.v1.3.7_ALL_languages.7z(118 MB),内置多国语言识别库。

  • SHA256: 5fcfbffce0148ff09ce58eea15a52c4d49c99903c7b5afd712f45862ba4026e1

多国语言扩展包:Umi-OCR.v1.3_DLC_languages.7z(50.5 MB),可向软件本体导入繁中,英,日,韩,俄,德,法 多国语言识别库。

  • SHA256: 709c867a610346217fc19a2251ead2a27d9dd0cf25e26ce05af007dbfc492974

Umi-OCR 文字识别工具 v1.3.3

28 Mar 11:24
Compare
Choose a tag to compare

Umi-OCR 文字识别工具 v1.3.2

04 Dec 08:46
Compare
Choose a tag to compare

v1.3.2 主要更新:

  • 新功能:创建开机启动项时,可选不显示主窗口
  • 新功能:OCR结果输出到每个图片同名的单独txt文件。
  • 新功能:增加独立的设置语言窗口,可在多处点开,便于切换语言。
  • 新功能:合并段落添加合并自然段-西文模式,可在英文段落换行时补充空格。
  • 新功能:快捷识图可选自动清空面板,只显示本次识别结果,且隐藏时间信息。
  • 修复了一些BUG。

文件说明

软件本体:Umi-OCR.v1.3.2.7z,内置简体中文&英文通用识别库。
多国语言扩展包:Umi-OCR.v1.3_DLC_languages.7z,可额外导入繁中,英,日,韩,俄,德,法 识别库。请按需下载。

Umi-OCR 文字识别工具 v1.3.1

22 Nov 05:22
Compare
Choose a tag to compare

v1.3.1 主要更新

  • 修Bug:解决快捷键有几率失效、录制不正确等问题。
  • 新功能:一键添加到开机自启、桌面快捷方式、开始菜单快捷方式。
  • 新功能:截图时隐藏窗口。
  • 优化:检查引擎组件是否存在。
  • 优化:横排-合并多行-自然段 优化逻辑,支持0~2全角空格首行缩进。

文件说明

软件本体:Umi-OCR.v1.3.1.7z,内置简体中文&英文通用识别库。
多国语言扩展包:Umi-OCR.v1.3_DLC_languages.7z,可额外导入繁中,英,日,韩,俄,德,法 识别库。请按需下载。

Umi-OCR 批量图片转文字 v1.3.0

07 Oct 04:37
Compare
Choose a tag to compare

下载 Umi-OCR.v1.3.0.7z
解压,点击 Umi-OCR 批量图片转文字.exe 启动程序。软件本体自带简体中文&英文识别库。

Umi-OCR.v1.3.0.DLC_languages.7z 为多国语言识别扩展包。
扩展包内置 繁中(新版,适合横排)、繁中(旧版,适合竖排)、日文、韩文、俄文、德文、法文识别库。下载后请按其中提示,将文件拷贝到软件目录下。

v1.3.0 主要更新:

  • 框选截屏:即时截屏,框选想要的区域,调用OCR。
  • 系统托盘:可将软件最小化到系统托盘区隐藏。
  • 文本块后处理:智能匹配并合并同一段落不同行的文字。可识别自然段。支持对竖排文本的排序和整理。
  • 修复了系统语言兼容性和微信图片粘贴问题的Bug。
  • 10.01临时更新 弹出模式:可配置软件窗口按需弹出 / 不弹出 / 锁定置顶。