Releases: bandtom/Umi-OCR
Umi-OCR v2.1.3
v2.1.3 主要更新:
bate.1 版本之后的更新:
- 修复:HTTP文档识别接口上传的文件名含非ascii字符时,该字符可被保留。
- 优化:HTTP文档识别接口的 Python示例 和 Html示例 代码。
- 优化:排版解析的 单栏-单行 方案,对于间隔较大的两个相邻文本块,会添加空格作为间隔符。
Windows7 和 Linux 用户注意: 常见问题及修复方法
Windows 下载
不同版本仅OCR引擎插件不同,其它功能完全一致,附带多国语言识别库。.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错 0xc0000142
、[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.3.7z.exe (134MB)
SHA256: 27f5eb5097ba8fe95bf8247cb186c9c8518f6c8268b4f5d828e2e80b9e40be34
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.3.7z.exe (97MB)
SHA256: de945941f785b9bbf6c7c5d82a5736c9b14a777d3503966c5ea110ac21ebc816
Linux 下载
Umi-OCR_Debian_x64_Paddle_2.1.3.tar.xz (273MB)
SHA256: 6d9596eaf482d4a37452bf8e960586fc66605d9c96047927270128a0a3a416fd
此发行版在 Ubuntu 22.04
/ Debian 12.5
/ Kali 2023.3
桌面环境中通过测试。由于 Linux 平台的多样化,发行版不一定能在所有环境中正常运行。如果遇到问题,可参考 常见问题及修复方法 ,或根据报错安装缺失的依赖库。欢迎提 Issue 共同讨论解决方法。有能力的用户可尝试 从源码部署 Umi-OCR ,以得到最好的兼容性。
首次运行请在命令行中执行 ./umi-ocr.sh
,随后可在全局设置中创建桌面/开始菜单快捷方式,便于日常使用。
Umi-OCR v2.1.1
两周年 & 两万星星撒花!
Celebrating the two-year anniversary of this project and reaching 20k stars!
作者的话
v2.1.1 主要更新 / Changelog
- 修复:
Windows7
及核心数<=2的CPU
无法进行文档识别的Bug。 - 新增:批量文档识别允许指定忽略区域的页数范围。
- 新增:命令行
--path
允许传入多个图片或文件夹。👉命令行手册 - 新增:新的命令行、HTTP接口:识别/生成二维码图像。👉HTTP手册
- 优化:双栏面板会记忆左右折叠状态。
- 完善 繁+英+日 界面本地化翻译。感谢 翻译人员 。
次要更新:(点击展开)
Windows7 用户注意: 常见问题及修复方法
配置文件迁移 / Configuration file migration
Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
Copy the UmiOCR-data/.settings
from the old version of the software to the same location in the new version.
下载说明 / Download Instructions
不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错 0xc0000142
、[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.0.7z.exe (129MB)
SHA256: 53e144b07c3ddfc1038e16926912de75c8212840c84cd56713f9e93ecc22e753
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.0.7z.exe (97.1MB)
SHA256: 09f10d04bd1915ad67a76e57e54adad781a295e8bbf64c7a3e7207f056cafee6
更多插件 / Plugins
前往 Umi-OCR_插件仓库 ,下载更多OCR插件,获取离线数学公式识别
等附加功能。
Visit the Umi-OCR_Plugins to download more OCR plugins and acquire additional features such as Offline Mathematical Formula Recognition
.
更多下载途径: 蓝奏云 | SourceForge | Scoop
release/2.1.0
重大更新:
- 批量文档识别。支持
pdf, epub, mobi
等多种格式的文档,对扫描件进行OCR或提取原有文本。可输出为 双层可搜索PDF 。 - 更强大的 排版解析 功能,代替之前的段落合并。基于 间隙树排序算法 ,解析多栏布局图片与文档时有较好的精度。
- HTTP接口参数作出了部分改动,并提供了一些更方便的选项。有需要的用户请重新参考 README_HTTP.md 。
⚠ Windows 7 用户注意:
文档识别可能在Win7上出现异常,如无法保存PDF文件、软件崩溃等。已知系统驱动、运行库不齐全的系统更有可能出现该问题。具体原因尚在调查中。
如果您发现了上述问题,请尝试安装常用运行库,并更新系统补丁到最新。或者,换用Win10及以上的系统进行文档识别。
其他功能在Win7上不受影响。
其它更新内容:
- 新增:允许隐藏托盘图标。 (#338)
- 新增:重复上一次截图区域的快捷键。 (#357)
- 新增:用本地图片浏览器打开图片的快捷按钮。 (#335)
- 修复:避免系统环境变量
QMLSCENE_DEVICE
的影响。 (#270) - 修复一些小问题,优化一些UI表现与提示语。
Help us translate / 帮助我们翻译!
We warmly invite translators to join us in our project's localization efforts!
You can review existing translations or contribute new ones.
Please visit the online platform Weblate at:
https://hosted.weblate.org/engage/umi-ocr/
配置文件迁移
Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
下载说明
不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.0.7z.exe (128MB)
SHA256: 5349728289f353a25b5f570fe11795bb60d80c1df419bcc9977899b6c1c723a6
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.0.7z.exe (97MB)
SHA256: 6460148b3b8fcdfb447ed8984a9c2fa232ca0cd156d8352f47d1841b2e3614ac
更多插件
前往 Umi-OCR_插件仓库 ,下载更多OCR插件,获取离线数学公式识别
等附加功能。
Umi-OCR v2.0.1
v2.0.1
更新内容:
- 【HTTP接口用户注意】 重新设计了HTTP接口。允许省略参数,允许设定段落合并。见HTTP使用手册。
- 命令行增加指令
-->
和-->>
,将结果输出到文件。见命令行使用手册。 - 优化:调整图像数据的内部编码,减少英文空格丢失的几率。
- 优化:调整部分UI文本和布局。
- 优化:csv默认保存为ansi编码,以兼容Office Excel。 (#237)
- 优化:Rapid插件移除了旧的简中-v3语言库,默认使用v4版。
- 修复:开启“禁用美化效果”后,外部通知弹窗无法关闭。 (#234)
- 修复:别的程序通过命令行调用Umi-OCR时,无法获取stdout输出。
配置文件迁移
v2.0.0 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
下载说明
不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.0.1.7z.exe (118MB)
SHA256: cb51be5c37f69ef6a4a5288c591051d240cf233929daff233a6e957c5eea600d
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.0.1.7z.exe (86MB)
SHA256: b2e316ff3386ae9b62d45aefa5bc4a7e23319a61f64c4d3ccf37dee4d5af666f
额外:数学公式识别插件
测试中,详见这里 。
Umi-OCR 文字识别工具 v1.3.7
公告:v2.0.0 预览版 开放测试!
开发重心转向v2,v1.x 版本可能将逐步停止维护。
测试阶段的 v2 可能含Bug。注重稳定的用户可继续使用 v1.3 版本。
v1.3.7
主要更新:
- 兼容 Win7 x64 。
- (若 Win7 报错
计算机中丢失 VCOMP140.DLL
,请安装 VC运行库 )
感谢 @vector090 提供的协助!
文件说明:
软件本体:Umi-OCR.v1.3.7.7z
(67.3 MB),内置简体中文&英文
通用识别库。
- SHA256:
8aff9198a5c1328c986fd13d9c17491727e994908f722cdea661dfcc01970587
软件(多国语言整合版):Umi-OCR.v1.3.7_ALL_languages.7z
(118 MB),内置多国语言识别库。
- SHA256:
5fcfbffce0148ff09ce58eea15a52c4d49c99903c7b5afd712f45862ba4026e1
多国语言扩展包:Umi-OCR.v1.3_DLC_languages.7z
(50.5 MB),可向软件本体导入繁中,英,日,韩,俄,德,法
多国语言识别库。
- SHA256:
709c867a610346217fc19a2251ead2a27d9dd0cf25e26ce05af007dbfc492974
Umi-OCR 文字识别工具 v1.3.3
Umi-OCR 文字识别工具 v1.3.2
v1.3.2
主要更新:
- 新功能:创建开机启动项时,可选
不显示主窗口
。 - 新功能:OCR结果输出到每个图片同名的单独txt文件。
- 新功能:增加独立的设置语言窗口,可在多处点开,便于切换语言。
- 新功能:合并段落添加
合并自然段-西文模式
,可在英文段落换行时补充空格。 - 新功能:快捷识图可选
自动清空面板
,只显示本次识别结果,且隐藏时间信息。 - 修复了一些BUG。
文件说明
软件本体:Umi-OCR.v1.3.2.7z
,内置简体中文&英文
通用识别库。
多国语言扩展包:Umi-OCR.v1.3_DLC_languages.7z
,可额外导入繁中,英,日,韩,俄,德,法
识别库。请按需下载。
Umi-OCR 文字识别工具 v1.3.1
v1.3.1
主要更新
- 修Bug:解决快捷键有几率失效、录制不正确等问题。
- 新功能:一键添加到开机自启、桌面快捷方式、开始菜单快捷方式。
- 新功能:截图时隐藏窗口。
- 优化:检查引擎组件是否存在。
- 优化:
横排-合并多行-自然段
优化逻辑,支持0~2全角空格首行缩进。
文件说明
软件本体:Umi-OCR.v1.3.1.7z
,内置简体中文&英文
通用识别库。
多国语言扩展包:Umi-OCR.v1.3_DLC_languages.7z
,可额外导入繁中,英,日,韩,俄,德,法
识别库。请按需下载。
Umi-OCR 批量图片转文字 v1.3.0
下载 Umi-OCR.v1.3.0.7z
解压,点击 Umi-OCR 批量图片转文字.exe
启动程序。软件本体自带简体中文&英文识别库。
Umi-OCR.v1.3.0.DLC_languages.7z
为多国语言识别扩展包。
扩展包内置 繁中(新版,适合横排)、繁中(旧版,适合竖排)、日文、韩文、俄文、德文、法文识别库。下载后请按其中提示,将文件拷贝到软件目录下。
v1.3.0
主要更新:
- 框选截屏:即时截屏,框选想要的区域,调用OCR。
- 系统托盘:可将软件最小化到系统托盘区隐藏。
- 文本块后处理:智能匹配并合并同一段落不同行的文字。可识别自然段。支持对竖排文本的排序和整理。
- 修复了系统语言兼容性和微信图片粘贴问题的Bug。
10.01临时更新
弹出模式:可配置软件窗口按需弹出 / 不弹出 / 锁定置顶。