Umi-OCR文字识别工具(离线识别不联网)

OCR 识别发展到现在精确度已经非常高了,各种网站吃相难看不让复制,有了 OCR 识别就可以一键提取出来了,对于一些软件内的文字说明也能通过此方式来复制文字

对于轻度使用的用户,其实微信截图就自带了,功能简单识别率也不错且方便好用,而且还没次数限制

以前分享过一款天若 OCR 也已经多年没更新,后续也有本地离线版流出,体验也一般般,这里就不推荐了,分享一款开源免费无广告的新工具 — Umi-OCR

纯本地识别处理,不用担心上传用户数据,方便识别一些私密的内容了

软件介绍

  • 免费:本项目所有代码开源,完全免费
  • 方便:解压即用,离线运行,无需网络
  • 高效:自带高效率离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快
  • 灵活:支持命令行、HTTP接口等多种调用方式
  • 功能:截图OCR / 批量OCR / 二维码 / 数学公式识别

软件支持多国语言,第一次打开软件时,将会按照你的电脑的系统设置,自动切换语言

标签页形式展示跟浏览器体验差不多,可快速切换相应功能界面

文字识别算是 Umi-OCR 最基础的功能了,设置好自定义快捷键后直接上手使用

识别后的文字段落排版还能自定义设置,更加方便内容提取

关于 OCR文本后处理 - 段落合并: 可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案:

  • 单行:合并同一行的文字,适合绝大部分情景。
  • 多行-自然段:智能识别、合并属于同一段落的文字,适合绝大部分情景,如上图所示。
  • 多行-代码段:尽可能还原原始排版的缩进与空格。适合识别代码片段,或需要保留空格的场景。
  • 竖排:适合竖排排版。需要与同样支持竖排识别的模型库配合使用。

批量识别支持批量图片和批量文档,支持主流的文件格式

保存识别结果的支持格式:txt, jsonl, md, csv(Excel)

与截图OCR一样,支持文本后处理功能,整理OCR文本的排版和顺序。没有数量上限,可一次性导入几百张图片进行任务。

文档识别功能也是一大特色了,老夜尝试一个稍微大点的 PDF 文件也是丝毫没问题,软件没出现崩溃的情况

  • 支持格式:pdf, xps, epub, mobi, fb2, cbz
  • 对扫描件进行OCR,或提取原有文本。可输出为 双层可搜索PDF
  • 支持设定 忽略区域 ,可用于排除页眉页脚的文字
  • 可设置任务完成后 自动关机/休眠

支持二维码识别,但是仅限于标准的二维码,对于那些美化过的码就无法识别

再补充一个二维码解码在线工具

https://cli.im/deqr

资源获取