国学数典

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 898|回复: 39

[闲话] 求推荐一款可以识别繁体字的OCR软件!

[复制链接]
  • TA的每日心情
    开心
    2019-11-16 07:49
  • 签到天数: 773 天

    [LV.10]以坛为家III

    发表于 2018-12-2 21:23 | 显示全部楼层 |阅读模式
    本帖最后由 qsxz108 于 2018-12-2 22:27 编辑

         请问各位坛友,有没有一款可以支持繁体字的OCR软件?(OCR:图片识别文字
         在下用过汉王、尚书七号、清华紫光、ABBYY finereader、天若ocr、图片文字识别、白描(安卓版)、传图识字(微信小程序)等,但这些软件要么不支持繁体,要么正确率很低,要么不支持竖排,竟没有一款好用的。不知哪位有好软件推荐?拜谢!
         

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    回复

    使用道具 举报

    该用户从未签到

    发表于 2018-12-2 21:46 来自手机 | 显示全部楼层
    我用abbyy,效果还可以,正确率跟你文件清晰度也有很大关系

    点评

    如果是清晰的图片,任何软件都可以胜任,但这种模糊图片,abbyy就不行了,白描比abbyy的识别率高,但不支持繁体识别。  发表于 2018-12-2 22:21
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-17 02:38
  • 签到天数: 1144 天

    [LV.10]以坛为家III

    发表于 2018-12-2 21:49 | 显示全部楼层
    這種手鈔本啊 還是去清華罷 他們有
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-16 07:49
  • 签到天数: 773 天

    [LV.10]以坛为家III

     楼主| 发表于 2018-12-2 22:22 | 显示全部楼层
    nieh 发表于 2018-12-2 21:49
    這種手鈔本啊 還是去清華罷 他們有

    去清华??不懂您的意思,拿到清华大学找人识别吗,那也太夸张了……
    回复 支持 反对

    使用道具 举报

    头像被屏蔽
  • TA的每日心情
    开心
    2019-3-30 16:17
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-12-2 22:57 | 显示全部楼层
    提示: 作者被禁止或删除 内容自动屏蔽
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2017-7-15 08:51
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2018-12-2 23:26 | 显示全部楼层
    这种手写你居然要求OCR,你咋不让他识别草书行书
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    郁闷
    2019-11-17 00:00
  • 签到天数: 1130 天

    [LV.10]以坛为家III

    发表于 2018-12-3 00:09 | 显示全部楼层
    古籍大都没几个字,识别的效果一般不会太好,还要校对,不如自己手动输入来得快。

    点评

    十几万字呢……如果识别率高的话,还是比手工录入要快一些。纯手打一天顶多一万字吧。  发表于 2018-12-3 08:55
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    无聊
    2019-11-17 01:46
  • 签到天数: 1095 天

    [LV.10]以坛为家III

    发表于 2018-12-3 00:53 | 显示全部楼层

    中文OCR总体准确率,还是不如拼音文字,繁体尤甚。

    点评

    原稿如果是印刷体会好些,然而要录的一般都不是印刷体……  发表于 2018-12-3 08:55
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-17 02:38
  • 签到天数: 1144 天

    [LV.10]以坛为家III

    发表于 2018-12-3 03:05 | 显示全部楼层
    qsxz108 发表于 2018-12-2 09:22
    去清华??不懂您的意思,拿到清华大学找人识别吗,那也太夸张了……

    清華大學有識別手鈔本的軟件 而且識別率非常高 差錯率萬字有兩三個罷。

    点评

    这么厉害!!估计只有内部人员才能用了。。  发表于 2018-12-3 08:56
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-10-10 21:42
  • 签到天数: 1030 天

    [LV.10]以坛为家III

    发表于 2018-12-3 06:52 | 显示全部楼层
    关键是识别出来的繁体字正确,文字工具才能转换正确,首先和底稿的清晰度有关。

    点评

    是啊,我这个底稿不够清晰,没办法……  发表于 2018-12-3 08:56
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2019-10-23 19:32
  • 签到天数: 432 天

    [LV.9]以坛为家II

    发表于 2018-12-3 07:26 | 显示全部楼层
    我覺得目前還是老老實實自己打字
    我現在都練出來了 一天能打6000字左右
    雖然費時間 但也試過ocr  加上校對 花的時間更多
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-7 12:21
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2018-12-3 07:55 | 显示全部楼层
    我用adobe
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2019-8-13 14:51
  • 签到天数: 142 天

    [LV.7]常住居民III

    发表于 2018-12-3 08:00 | 显示全部楼层
    尝试过不少文字识别软件,有时候错的匪夷所思,最后花在校对上的时间比手打时间还长。

    点评

    同感,折腾了两三个小时才弄了几页,还不如手打。。  发表于 2018-12-3 08:58
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-15 08:11
  • 签到天数: 753 天

    [LV.10]以坛为家III

    发表于 2018-12-3 08:10 | 显示全部楼层
    恐怕沒有那個軟件識別後不用校對的吧?

    点评

    如果识别率高的话,批量识别完再校对,肯定比纯手打要快得多。自己纯手打,完了也得校对一遍呢。  发表于 2018-12-3 08:59
    如果识别率高的话,批量识别完再校对,肯定比纯手打要快得多。自己纯手打,完了也得校对一遍呢。  发表于 2018-12-3 08:59
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-17 07:58
  • 签到天数: 891 天

    [LV.10]以坛为家III

    发表于 2018-12-3 08:42 | 显示全部楼层
    shangqin 发表于 2018-12-2 21:46
    我用abbyy,效果还可以,正确率跟你文件清晰度也有很大关系

    abbyy一个月就到期了。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-16 07:49
  • 签到天数: 773 天

    [LV.10]以坛为家III

     楼主| 发表于 2018-12-3 08:51 | 显示全部楼层
    冰刃 发表于 2018-12-2 23:26
    这种手写你居然要求OCR,你咋不让他识别草书行书

    这个手写本楷法精工,所以才想识别的。其实草书也不是不可以,现在有这样的软件的,只不过效率极低,只可作为辅助手段。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-16 07:49
  • 签到天数: 773 天

    [LV.10]以坛为家III

     楼主| 发表于 2018-12-3 08:57 | 显示全部楼层
    十年为期 发表于 2018-12-3 07:26
    我覺得目前還是老老實實自己打字
    我現在都練出來了 一天能打6000字左右
    雖然費時間 但也試過ocr  加上校對  ...

    我一小时录千字左右,如果去上图、南图,在紧张压力下可以达到1300字。一天如果打12小时就可以达到10000字了。。。。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-17 00:16
  • 签到天数: 893 天

    [LV.10]以坛为家III

    发表于 2018-12-3 09:28 | 显示全部楼层
    手打一个比一个厉害
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-15 08:44
  • 签到天数: 156 天

    [LV.7]常住居民III

    发表于 2018-12-3 09:38 | 显示全部楼层
    ABBYY FineReader  关键还是源文件的清晰度。印刷的肯定不手写的也好的多
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-10 12:19
  • 签到天数: 321 天

    [LV.8]以坛为家I

    发表于 2018-12-3 09:40 | 显示全部楼层
    要么正确率很低,要么不支持竖排,竟没有一款好用的。不知哪位有好软件推荐?拜谢!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2019-3-21 18:32
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2018-12-3 12:13 | 显示全部楼层
    以上列举的我也都用过,感觉最好的还是ABBYY finereader,正确率一般在90%以上,不管简体还是繁体,但是手写体,我觉得可能什么软件都不行吧。
    回复 支持 反对

    使用道具 举报

    头像被屏蔽
  • TA的每日心情
    开心
    2019-3-30 16:17
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-12-3 12:36 | 显示全部楼层
    提示: 作者被禁止或删除 内容自动屏蔽
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-10-17 13:12
  • 签到天数: 73 天

    [LV.6]常住居民II

    发表于 2018-12-3 12:46 | 显示全部楼层
    手抄古本的OCR基本没戏,错误率很高~如果是已经编辑成书的古文(包括竖排的),用汉王的那款最新的还是可以的
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    郁闷
    2019-11-17 12:55
  • 签到天数: 107 天

    [LV.6]常住居民II

    发表于 2018-12-3 12:55 | 显示全部楼层
    我感觉还是装两个电子屏幕好,一个是显示繁体,另一个可以打印出来简体,效果也很好啊
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    2019-7-24 19:22
  • 签到天数: 57 天

    [LV.5]常住居民I

    发表于 2018-12-3 13:29 | 显示全部楼层
    识别雕版印刷的繁体,汉王和尚书七号问题不大。但是,前提是,你要把相关的参数设置正确,不能完全依赖傻瓜化操作。这主要涉及两个方面:一是把语言设置为“简繁混合”【具体步骤为:文件→系统配置→获取新图像→简繁混合】;二是导入图片后,要把“栏属性”设置正确,即在图像、横栏、竖栏、表格四项中选定竖栏。【具体步骤为:识别→选定全部文件→版面分析→修改栏属性→竖栏】

    至于书法,就不容易了,即使是楷体,都带有明显的个人风格,字形规范性不足,识别难度增大。还有一个原因,就是书法作品的图片,往往存在背景色,还不单一,这样一来,会对识别产生干扰。所以,书法作品的文本内容,尽量以打字方式输入电脑文档为好。

    点评

    多谢指点!  发表于 2018-12-6 13:20
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-6-26 13:46
  • 签到天数: 535 天

    [LV.9]以坛为家II

    发表于 2018-12-6 07:12 | 显示全部楼层
    图片质量太低了。人看着都晕,软件更别说了。

    点评

    是啊,然而没办法,量太大。。。想偷懒都没法  发表于 2018-12-6 13:19
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-16 18:47
  • 签到天数: 11 天

    [LV.3]偶尔看看II

    发表于 2019-10-29 22:13 | 显示全部楼层
    要录地方志的人表示,印刷质量那么差,糊糊的,真的人眼都分辨不出来啊,软件当然无法识别啊,太惨了我……

    点评

    关键在于出版社技术不行、资金太少,所以影印得太模糊。  发表于 2019-10-31 00:18
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2019-11-9 22:29 | 显示全部楼层
    感谢大侠推荐好软件!

    评分

    1

    查看全部评分

    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条

    Archiver|手机版|小黑屋|国学数典 ( 2006-2019 冀ICP备19008975号-2 )

    GMT+8, 2019-11-17 22:51

    Powered by Discuz! X3.4

    © 2001-2017 Comsenz Inc.

    快速回复 返回顶部 返回列表