天若OCR-开源好用的本地文字识别工具

图形图像 讯维网络 2周前 (09-16) 25次浏览 已收录 0个评论 扫描二维码

软件介绍

天若OCR文字识别专业版是一款个人开发的ocr文字识别软件,在日常的生活中,我们经常会碰到这样的情况,那就是别人发来的文稿图片需要我们自己手打输入文本中,而图片中的文字只能看着却不能编辑,望着满满20多页的文字,这是一键非常痛苦的事情。而这时候,就完全体现出了OCR工具的重要性了,专业版在普通版的基础上拓展了更多的功能,目前拥有很多功能识别、截图、贴图、录制Gif、文本翻译、段落排版等一系列功能,软件只有识别功能收费,云配置,截图等一系列功能全部免费。有需要的朋友,欢迎随时来本站下载使用!
在天若 OCR 文字识别工具5.0的基础上采用本地化识别,不用担心网络问题,cl和paddle-ocr识别准确度和速度都很快。操作和普通天若一样,f4是截图,接口可以切换cl或者paddle。推荐用paddle识别,效果很好。win7可以使用,可以翻译,段落合并。
本软件为64位系统使用,支持Win11/Win10/win7系统,需要.net4.7.2环境和Microsoft Visual C++ 运行库。

天若OCR-开源好用的本地文字识别工具

天若OCR-开源好用的本地文字识别工具

天若OCR-开源好用的本地文字识别工具

版本更新说明

v1.3.5(2022.8.14)(非重要更新,非区域问题可不下载)
彻底抛弃ini结构,采用xml结构utf8储存配置,适应不同语言环境(非unicode语言为中文以外的情况)
修改paddle默认参数适应小框识别的问题 I5LRD0
v1.3.4(2022.8.10)
彻底解决paddle识别率不高的bug
不再使用fody合并dll
v1.3.3(2022.8.7)
更新了paddle为v3模型,与RapidOCR一致,
关于之前反馈的模型识别率更低了的问题,我自认为解决了(并没有解决,心态爆炸,就算替换模型也不如1.2.5版本,咋回事啊,那咋整啊,但是只要切换一次cl再切回paddle,paddle又好使了,心态确实不好了,我决定有空好好弄下,但不是现在)
更改nuget包管理为PackageReference,更新emgu等库
解决了在不同语言环境下读取ini文件的问题,ini文件现在编码为unicode编码
v1.3.2(2022.3.11)
修改了模型名称,方便更新替换。同时更新了paddle的模型,与RapidOCR一致,准确率有提升的。
v1.3.1(2022.1.29)
修正了开启默认合并行数据丢失的问题
使用fody合并dll,减小文件数量
v1.3(2021.12.27)
Win7也能用了!(详请见更新说明)
段落合并功能bug修复
尝试解决识别文本和显示不一样的bug,也就是识别框出现很多重复文字的bug(实际没有这些文字,只是显示而已)
谷歌翻译采用“ZZK-1989”大佬的方式,更加快速,且支持段落识别,但是能不能翻译全凭网络流畅与否
切换模型和修改模型不再需要重启应用,只需要随便切换一次模型即可(将载入模型放在了切换模型的位置)
v1.2.6
修正一个编译bug(具体情况是编译识别为空)
更加合理的段落合并功能,拆分按钮现状不会清空文字了,但是依然没用
采用64位编译
v1.2.5
把原来删除的百度在线ocr给撤销回来了,现在可以使用了,并且加入了错误检测,避免崩溃
段落翻译增加了延时,避免ip被封
v1.2.4
添加了保留段落翻译,不再合并段落翻译,切换接口即可,由于单独翻译,速度可能稍慢
v1.2.3
添加了参数帮助(注释)
v1.2.2
修复了不能重启的bug
v1.2.1
修复了不能切换模型的bug,初始paddle模型是选的英文
v1.2
更新了翻译接口,现在谷歌和百度可以用了!换行会自动处理成量起来的,方便pdf。百度需要申请API
添加了几个轻量模型(日文和英文专精),切换需要重启
修复了部分bug,清理了部分源码
应该不会再更新了!
V1.1
添加了paddle-ocr支持,模型并不大,速度快!
可以切换接口了,虽然工程里面名字还是其他名字,但是编译出来的不会显示搜狗和腾讯了
优化了内存占用(每次识别完自动清理内存)
V1.0
添加了Chineseocr-lite支持,使用原来搜狗的接口选项
一些碎碎念
v1.3.4
一杯茶一包烟,一个bug调一天,paddle识别不高的原因是因为模型所设置参数没有初始化,导致第一次时候程序识别不行,但是切换下模型相当于初始化又好了。。。。具体问题在438行,调用的参数错误

v1.3.3
win7编译后需要手动替换onnxruntime.dll,版本为1.6,vs nuget中的不支持win7,github上下载的支持。尝试解决读取ini文件的问题,本来想改成utf8格式读取,但是试了很久都不行,用了大概3天一无所获,不过今天用了别人的库一下就没问题了………..还是crtlv好用

v1.3
win7支持源自与逛吾爱时看到有大佬做出来ncnn和onnx的差不多的天若本地版,目的就是解决我的不支持win7的问题,可惜没有开源,但是大佬提供了思路,然后顺着大佬思路,我也自己编译了onnxruntime,得益于微软的开源,编译很简单,然后又修正了下库的引用,在win7上真的跑起来了(我用了虚拟机)。我编译的是onnxruntime 1.5.2版本,1.6我试了好像不支持了,具体不清楚。当然大佬还做了其他差异化的东西,例如二维码,局域网网页调用,我就没做了,自己还是太菜,应该不会再更新了,算是圆满了,这个项目其实只是简单粘贴复制,方法很菜,希望有朝一日能给大家提供一点微薄的帮助。


讯维网络 , 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:天若OCR-开源好用的本地文字识别工具
喜欢 (0)
[]
分享 (0)
发表我的评论
取消评论

CAPTCHAis initialing...

表情 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址