本地OCR

本地OCR 公开

stonev 更新于 2021-07-14 15:53 | 14 | 281
如何安装动作?

适用于
分类
OCR
PanpanLynn 89268690 花花ai 苏腾kaze 化工兔 14 人赞了这个动作

1 个动作单 收藏了此动作。

更多信息
分享时间 2020-07-29 14:17
最后更新 2021-07-14 15:53
修订版本 7
用户许可 -未设置-
Quicker版本 1.25.5
动作大小 40.7 KB

分享到

「使用本地OCR识别 识别图片文字」

简介

第一次运行会从作者的资料服务器下载一个约40MB的核心包 解压后80MB左右(推荐 右键->选择下载核心包->选择第一个 仅2.5MB)
核心路径:Quicker应用程序文件夹/Tesseract/tesseract.exe
基于开源项目:https://github.com/tesseract-ocr/tesseract
优势:
1.除了第一次需要下载核心OCR文件之后可以无需网络运行
2.没有频率限制无需百度账号
缺点:
1.识别准确度和效果相比百度有所下降

PS:这个版本所用的程序为我从Github下载的代码重新编译的最小包 可以随意取用 包括程序缓存地址 欢迎二次开发 无需担心感染或者劫持

2021年7月14日
1.更新了 核心包 删除与下载功能 (目前提供了两个版本的核心包)
2.更新了语言包下载功能 和 选择要使用的语言包功能

默认语言包下载地址:http://assets.jyjhjd.com/tessdata/

其他语言包下载地址:
最优:https://github.com/tesseract-ocr/tessdata_best
最快:https://github.com/tesseract-ocr/tessdata_fast
社区:https://tesseract-ocr.github.io/tessdoc/Data-Files-Contributions.html

(由于语言种类过多 且提供的都是缩写 如有翻译好的文本可以加我QQ我给他把中文加进去 )

最近更新

修订版本 更新时间 更新说明
7 2021-07-14 15:53 添加部分语言中文
6 2021-07-14 14:29 上传了新的ocr核心 单独核心压缩包仅2.3MB 拆分语言训练文件 可以单独下载不同的语言文件 默认使用的是旧版本 请主动右键删除核心和选择新版本下载 语言包下载地址:http://assets.jyjhjd.com/tessdata/ 其他语言包下载地址:
最优:https://github.com/tesseract-ocr/tessdata_best
最快:https://github.com/tesseract-ocr/tessdata_fast
社区:https://tesseract-ocr.github.io/tessdoc/Data-Files-Contributions.html
5 2021-07-13 14:35 缩减了代码量 和缓存文件 输出

最近讨论

异常报告 · 502
用户3502218785... 2022-01-04 16:04 逆熵 2022-03-06 16:15
使用问题 · 465
longping 2021-12-09 19:51 化工兔 2022-08-29 12:59