Redian新闻
>
完全免费,不用联网,这套OCR工具比微信的还好用!

完全免费,不用联网,这套OCR工具比微信的还好用!

科技



前段时间,微信 PC 端更新了一个 OCR 功能,能识别图片里的文字。


 说实话,这应该是微信 10 年来推出的最实用功能之一了。


比如你用微信截图时,只要点击下方的「 识别文字 」,就可以获取截图里的文字。


在微信里收到的图片,也支持你直接选取文字复制。


除了功能实用,另一方面,微信早已成了电脑上必装软件,微信截图也是很多人默认截图工具。


所以微信 OCR 就好比系统功能一样,无需任何安装成本,以后遇到什么无法复制的文字,调出微信就好。


一般来说,微信 OCR 是可以满足大部分人的需求。


 但因为功能较基础,在一些特殊情况时,它就显得有点笨了。


比如你有很多文字需要识别,那就得一次次截图再一次次识别,再一次次复制。


或者你要 OCR 一段古诗,文字是纵向且自右向左,那微信识别出的顺序就会乱。


就在最近,世超发现了一款叫 Umi-OCR 的工具( 支持 Win10&11 )


 它的功能很强大,支持你批量识别图片、选择屏蔽区域、指定文字方向,微信能不到的它都能做到。


噢最关键的是,它免费开源,无需安装、无需网络,离线可用。


简单给大家演示一下。


假如下面是一段要充钱才能复制的文字,我们点击软件的截图功能,然后把文字框住,0.73 秒后就能获得文字。


因为是本地运行,电脑性能越强,耗时会越短。


和微信不同的是,Umi-OCR 自带了一个记录板,每次识别出的文字会出现在记录板,并一直保存。


这就是说,如果你有一堆要识别的文字,就可以像打连狙一样,连续截图。


截完所有的图片,记录板上也已经识别了所有文字。


到这时你再来复制粘贴啥的,会方便很多。


当然还有一种情况,你本地里已经存好了所有的图片,那这就更方便了。


Umi-OCR 支持批量识别,如果说刚才是连狙,那么这个功能就是一键加特林。


直接扔几百张图片过去,剩下的交给 Umi-OCR。


接着,记录板上就会出现一行行的文字。


与此同时,识别结果还会以 txt 文件保存起来,可以说一条龙服务齐全了。


如果你不需要 txt,而是 md、jsonl 的格式,没关系它都支持。


除了刚才说的这几项,Umi-OCR 还有一些细节功能,可以照顾到特殊情况。


举个例子,下面这个图你只想要正文里的那一句话,水印等其他无效信息不想要。


要是一张图,你截图划一个区域就行了。


但要是有 100 张类似的图呢?


诶,这个软件支持你指定识别区域。


只要你导入一张照片,然后选择一些要屏蔽的区域,那接下来所有同分辨率的图片,识别时就会自动屏蔽这些区域。


这样批量识别出的结果,就只有我们想要的部分了。


另外,Umi-OCR 还可以调整段落化。


什么意思呢,一般 OCR 段落识别是根据行距来的,行与行之间空隙大了,它就会判断为下一段。


但如果遇到下面这样的特殊格式,一句话就是一段,距离很近,那 OCR 工具会把它们识别成一句话,合在一起。


比如微信识别出来是这样的。


但 Umi-OCR 支持段落优化,不同的段落格式可以选择不同的设置,如单行优化、左对齐、自然段等等。


遇到刚才的格式,就可以选择「 优化单行 」。


其他的情况也都有对应的选项,下图供参考。


最后,Umi-OCR 还支持更改文字识别方向。


比如你要识别一首古诗,只要选择一下「 文字方向为纵向、从右到左 」即可。


对了有一点忘了提,除了支持中文、英文识别,通过导入多语言识别扩展包,Umi-OCR 还支持繁中、日、韩、俄、德、法等语言,链接会一起放在文末。


我知道,大家肯定关心它的识别准确率,我只能说表现尚可。


在第一张测试图里,世超就发现捂脸表情被识别成一个然后少了一个引号和一个句号。


小表情识别成文字,这点错误各位应该可以接受,毕竟没多少文章像我们这样,写着写着塞点表情。


 引号和句号丢失,我认为无伤大雅。


但除了这几个问题,Umi-OCR 也会识别错文字,比如把「 毕竟 」识别成了「 华竟 」。


另外,世超建议各位不要用它识别一些粗体字,效果不太理想。


当然,大家也不要因此拒绝使用 Umi-OCR,市面上就没有一家 OCR 工具敢保证 100% 准确率。


像刚才的古诗,Umi-OCR 错了最后一个字,但微信 OCR 识别下来,就没几个对的了。


此外,微信 OCR 还会把粗体的 MVP 识别成 MUP。


所以说,使用 OCR,不管你用的是哪家,都要做好会遇到识别错误的准备。世超是建议大家每次自己再简单检查一遍。


还是那句话,如果只是偶尔需要 OCR,那还是微信好。


但如果你的需求很大,很特殊,害怕泄露隐私啥的,那这款 Umi-OCR 更适合你。


GitHub 地址:

 https : //github.com/hiroi-sora/Umi-OCR/releases/tag/v1.3.1 


蓝奏云链接: 

 https : //hiroi-sora.lanzoul.com/s/umi-ocr 


撰文:刺猬    编辑:面线


图片、资料来源:

Umi-OCR 作者:hiroi-sora



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
「瑞欧威尔」获数千万元新一轮融资,深化AR工业元宇宙在垂直领域的应用|36氪首发11 款超赞的 MySQL 图形化工具,好用!在爱尔兰如何接种流感疫苗?儿童、老人、孕妇等完全免费5款程序员必备的免费在线画图工具,超级好用!这远程控制工具如此强悍还免费,让付费软件怎么活?5 款顶级 Docker 可视化管理工具,免费又好用!我们试用了28天,被这款国货美妆狂种草,平价还好用!超推荐妈妈们试试不用糖醋,不用红烧!上锅不用管,这做法还是第1次口臭的“克星”找到了!比牙膏、漱口水还好用!还能改善肠胃!牡蛎煎蛋首个ChatGPT国产平替来了!ChatYuan发布测试版,无需翻墙注册,体验完全免费寒假让孩子爱上读书,有一个国家提供的“大便宜”,咱不用白不用!完全免费,随用随开,这个14MB的PS真不错。​新鲜!它把头皮当脸养,狂加奢侈护肤成分,香味媲美大牌香水,便宜大桶还好用!新课上线 | 上市30个月销售额超73亿元,这套超级文案方法论太实用!免费!好用!最值得推荐的8款宝藏小程序,过年前赶紧安利你腾讯出品的6个AI智能神器,良心免费,还都好用到爆!警惕!微信的这个功能成为新诈骗工具!《西罗普郡一少年》:61: 休莱塔超级好用!这个R包在GWAS分析中常见,实用!好学!不回你微信的人,大多是这几种心理联想拯救者系列新品预计将采用联发科最新 Wi-Fi 7 技术马斯克开始“整顿”臃肿技术架构?Twitter工程师叫板:先拿个学位再来指手画脚,技术专家纷纷表示支持【忽然一周】芭比娃娃制造商美泰入驻Roblox;乐高上半年全球新开66家品牌零售店46家在中国;全面涨价,法国玩具比往年更贵;跑步看世界 – 波士顿大学不愧是全世界女人共同的梦想!好用!确实很好用!2023年的业务目标该如何完成?OKR工作法助力业务突破喷香!外酥内软的葱油饼只要2.9元1张,比外面卖的还好吃!动辄上万块的写字课,竟都始于这套控笔练习,关键它还全免费!3-6岁 | 让孩子不乱发脾气,告别坏情绪,这套绘本太好用!积分竟然比微分早了1300年!一文讲清积分的历史左脑好用,右脑更好用!天才科学家的智商比普通人高的秘密原来是这样《山居续忆》:第九章:老李 (六)娃用这套教辅书,不用报班就能轻松学好大语文|开团谣言与党争下的拜登“开放式边境”
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。