批量图片识别 Umi-OCR v2.1.2 中文绿色版
本帖最后由 糖拌饭 于 2024-8-14 13:35 编辑介绍
Umi-OCR用于批量导入本地图片,识别图片中的文本,输出到软件面板或本地txt文件。 除了能批量识别普通图片,本软件还有忽略指定区域的特殊功能。类似含水印的视频截图、含有UI/按钮的游戏截图等,往往只需要提取字幕区域的文本,而避免提取到水印和UI文本。本软件可设置忽略某些区域内的文字,来实现这一目的。尤其是,特别适合用于批量提取Galgame截图中的台词。当有大量的影视和游戏截图需要整理归档,或者想翻找包含某一段台词/字幕的截图;将这些图片提取出文字、然后Ctrl+F是一个很有效的方法。这是开发本软件的初衷。
软件截图
软件特点
忽略区域功能
忽略区域是本软件特色功能。可用于批量识别视频截图时排除右上角水印的干扰,批量识别游戏截图时排除UI与按钮的干扰,让识别结果只留下干净的台词文本。
“忽略区域”是指图片上指定位置与大小的矩形区域,完全处于这些区域内的文字块,将被排除。
点击 设置 选项卡中的 添加忽略区域 ,进入忽略区域选择窗口。
将任意图片 拖入 该窗口,可预览该图片。将新图片拖入窗口可切换预览,但已绘制的忽略区域不会消失;可切换不同图片来仔细调整忽略区域。
绘制 忽略区域 :拖入图片后,点击选中左起第一按钮 +忽略区域 1 ,然后在图片上按住左键拖拽,绘制矩形区域。可 撤销 步骤。
绘制完后,点击 完成 返回软件主窗口。若不想应用此次绘制,则右上角X,取消。
本软件使用离线OCR模块 PaddleOCR-json 图片转文字程序 ,使用过程中无需联网。支持更换Paddle官方模型(v2.x版本)或自己训练的模型,支持修改PaddleOCR参数。通过添加不同的语言模型,软件可识别多国语言。
更新日志
v2.1.2 主要更新 / Changelog
新增:批量任务(图片、文档)支持 暂停任务 。只要不退出软件,在待机/休眠后可以恢复任务。
新增:文档任务支持保存为 单层纯文本PDF 。
新增:HTTP OCR接口 允许设置 忽略区域 参数。
新增:HTTP 二维码接口 允许设置 图像预处理 参数。
新增:命令行--screenshot允许 指定屏幕范围 ,自动进行截图。
修复:文档内容提取和写入时的坐标旋转、比例适配问题。
优化:批量文档标签页,拖入大量文件、提交大批任务时的性能和流畅度。
优化:文档任务保存的文件名规则。
UI:优化一些布局,调整一些文本,美化一些视觉效果。
下载说明
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
分享文件:批量图片识别 Umi-OCR v2.1.2 中文绿色版
链接:https://pan.xunlei.com/s/VO-ne741TxI3px8QoZ1mXMkcA1?pwd=zqj8#
链接:https://pan.quark.cn/s/eec21f00a2c3
锄禾日当午,发帖真辛苦。谁知坛中餐,帖帖皆辛苦! 不错 支持一个了 顶起顶起顶起 顶顶更健康 回个帖子,下班咯~ 顶起顶起顶起 我也是坐沙发的 鼎力支持!! 我也来顶一下..
页:
[1]
2