国学数典

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 107726|回复: 570

[工具] UnicornViewer v0.12c--289楼更新到0.12j

    [复制链接]

该用户从未签到

发表于 2008-4-26 13:49 | 显示全部楼层 |阅读模式
本帖最后由 yalama 于 2010-9-22 16:39 编辑

仿照Acrobat、WinDjView做的浏览器,包括连续翻页、多级目录、打印等。
文件格式支持PDG和多页TIFF。PDG只支持图像版0xH、1xH、28H、AxH,不支持FFH、6xH和文本PDG。
使用前请先阅读使用说明,使用后欢迎回帖说明一下感受。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

17

查看全部评分

  • TA的每日心情
    开心
    2019-4-20 10:05
  • 签到天数: 384 天

    [LV.9]以坛为家II

    发表于 2010-9-22 16:29 | 显示全部楼层
    老马的UV软件升级到了UnicornViewer_v0[1][1].12j_chn!

    Version 0.12j
    新增功能:光标为手型时,鼠标左键双击向后翻页,按住Ctrl键双击左键向前翻页。
    功能增强:图像放大算法从bilinear改为带锐化的bicubic算法,文字更锐利,速度稍慢。
    功能增强:加强繁简转换时的纠错能力。
    错误修正:如果背景色不是灰色,缩放后文字边缘出现杂色。
    错误修正:某些多页TIFF文件的页码顺序显示不正确。
    错误修正:某些Old-style JPEG压缩的TIFF文件显示有错。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x

    评分

    1

    查看全部评分

    回复 支持 3 反对 0

    使用道具 举报

  • TA的每日心情
    开心
    2018-10-23 15:56
  • 签到天数: 93 天

    [LV.6]常住居民II

    发表于 2018-6-21 09:18 | 显示全部楼层
    找到一个0.22版的,大家试试

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    回复 支持 1 反对 0

    使用道具 举报

    该用户从未签到

    发表于 2008-4-27 01:17 | 显示全部楼层
    原帖由 jingyu 于 2008-4-26 15:42 发表
    谢谢老马,老马软件永远是这么功能强大而不复杂,干净、漂亮!

    不好意思哈,我有疑问,“文件格式支持PDG和PDF、DjVu、多页TIFF”是什么意思?

    DJVU和TIFF指的是“新增功能:支持名为PDG,实为DjVu的文件。新增 ...


    据老马透露0.13及0.14开始支持PDF及DJVU(不必改名为PDG)。

    评分

    1

    查看全部评分

    回复 支持 0 反对 1

    使用道具 举报

    该用户从未签到

    发表于 2008-4-26 15:09 | 显示全部楼层
    呵呵,多谢老马兄
    几个网站中,受惠于兄的人很多,俺是一个
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-26 15:42 | 显示全部楼层
    谢谢老马,老马软件永远是这么功能强大而不复杂,干净、漂亮!

    不好意思哈,我有疑问,“文件格式支持PDG和PDF、DjVu、多页TIFF”是什么意思?

    DJVU和TIFF指的是“新增功能:支持名为PDG,实为DjVu的文件。新增功能:支持名为PDG,实为单页TIFF的文件。”吧,那支持PDF呢?

    [ 本帖最后由 jingyu 于 2008-4-26 17:20 编辑 ]
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-11-13 22:24
  • 签到天数: 186 天

    [LV.7]常住居民III

    发表于 2008-4-26 15:50 | 显示全部楼层
    多谢老马兄, OCR功能很有用。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-26 15:58 | 显示全部楼层

    回复

    首先感谢。特别在阅读DjVu格式文件时非常清晰,但不能阅读PDF格式文件,在软件介绍中只有下次升级版才能支持!
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-26 16:40 | 显示全部楼层
    谢谢老马兄,另外想请教老马兄,如何把jpeg格式转换为pdf等可用电子阅览器阅览的格式。前段时间在电驴商下了一套经典收藏,可惜都是jpeg格式,收藏可以,但是阅读起来很麻烦。如能转换为电子书格式,想来体积会变小,阅读也方便,也可以传上来与众家兄弟分享。

    评分

    1

    查看全部评分

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-26 19:46 | 显示全部楼层
    谢谢了,真是一个好东西,十分感谢哈哈
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2017-10-25 13:53
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2008-4-26 20:06 | 显示全部楼层
    感谢老马的精品软件,觉得最有用的新功能就是可以关联文件了,哈哈,太方便了。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-26 21:14 | 显示全部楼层
    原来是阅读电子书的软件啊,一定要下载用用。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-26 22:33 | 显示全部楼层
    我还没有用过,不过看大家这么推崇,一定要下来看看
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-26 22:34 | 显示全部楼层
    狂顶马大侠的新作问世~
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-3-25 23:53
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    发表于 2008-4-26 22:59 | 显示全部楼层
    可惜手里好多超星的书都不能用这个软件看,目录能显示,正文却是空白。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-26 23:25 | 显示全部楼层
    谢谢老马,终于等到了升级

    [ 本帖最后由 wakakawa 于 2008-4-26 23:30 编辑 ]
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-27 00:50 | 显示全部楼层

    回复 1楼 的帖子

    seems complicated for me to read the instruction, anyway, tks a lot

    建议用中文,这样不太费眼神---阿Q
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-27 01:08 | 显示全部楼层
    多谢马兄!功德无量啊!
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-27 01:39 | 显示全部楼层
    现在午夜看到这个好消息,确实会让人做好梦的。赶紧下载,使用看看。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-27 05:48 | 显示全部楼层
    又得马兄的精品新工具一端。
    先拜谢,再下载。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-3-24 18:09
  • 签到天数: 554 天

    [LV.9]以坛为家II

    发表于 2008-4-27 08:02 | 显示全部楼层
    请教高手,使用小马哥的这款pdg阅读器,怎么OCR呢?我过去就整不明白,现在看见4楼仁兄说OCR很好用,想必一定熟练了。请介绍详细一点,先谢谢啊!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-11-13 22:24
  • 签到天数: 186 天

    [LV.7]常住居民III

    发表于 2008-4-27 08:42 | 显示全部楼层
    原帖由 ben6 于 2008-4-27 08:02 发表
    请教高手,使用小马哥的这款pdg阅读器,怎么OCR呢?我过去就整不明白,现在看见4楼仁兄说OCR很好用,想必一定熟练了。请介绍详细一点,先谢谢啊!

    帮助一定要详细读。

    [ 本帖最后由 say 于 2008-4-27 08:43 编辑 ]

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x

    评分

    2

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-20 10:05
  • 签到天数: 384 天

    [LV.9]以坛为家II

    发表于 2008-4-27 09:53 | 显示全部楼层
    这个工具用很久了。很好用!现在又升级了。要谢谢老马了。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-3-24 18:09
  • 签到天数: 554 天

    [LV.9]以坛为家II

    发表于 2008-4-27 09:55 | 显示全部楼层

    谢谢,但是……

    首先谢谢4楼仁兄的详细图示,这么快就回帖了。但是,我还是不明白。因为我就是按照您的图示123步骤这样OCR的,但是结果却是“抱歉,OCR结果为空”。我就不明白,因为我就是从论坛上下载的软件啊,应该没有什么问题。
        不好意思,还请您检查一下,看看究竟是什么原因?或许也可能是小马哥设计的漏洞(?),一笑。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-20 09:02
  • 签到天数: 143 天

    [LV.7]常住居民III

    发表于 2008-4-27 10:04 | 显示全部楼层
    老马兄久仰
    头一次使用这个软件,摸索中……
    是不是主要面对pdg编码文件的
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-27 10:37 | 显示全部楼层
    原帖由 ben6 于 2008-4-27 09:55 发表
    首先谢谢4楼仁兄的详细图示,这么快就回帖了。但是,我还是不明白。因为我就是按照您的图示123步骤这样OCR的,但是结果却是“抱歉,OCR结果为空”。我就不明白,因为我就是从论坛上下载的软件啊,应该没有什么问题。 ...
    需要事先安装office2003的扫描程序Microsoft Office Document Imaging
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-19 08:43
  • 签到天数: 400 天

    [LV.9]以坛为家II

    发表于 2008-4-27 10:38 | 显示全部楼层
    非常感谢老马兄!
    我在OCR识别繁体时,阅读器自动安装相关支持,让我插入office2003的安装光盘,安装时提示找不到“m4561421.cab“文件,但我的安装文件夹下确实有这个文件,他它总提示找不到,我拷贝出这个文件放另一文件夹下,它仍然说找不到,咋回事啊?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-7-16 17:09
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    发表于 2008-4-27 11:05 | 显示全部楼层
    以前不知道这款软件是干什么用的,看了大家的介绍,尤其是20楼的例子,竟然能识别竖排版的书籍,呵呵,真是太吸引人了,下载一试。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-11-13 22:24
  • 签到天数: 186 天

    [LV.7]常住居民III

    发表于 2008-4-27 12:33 | 显示全部楼层
    关于OCR问题,我把老马《在简体中文Office 2003下OCR繁体中文、日文、韩文》贴出来,可能对大家有所帮助。

    在简体中文Office 2003下
    OCR繁体中文、日文、韩文
    作者:马健
    邮箱:stronghorse@tom.com
    主页:http://stronghorse.yeah.net
    发布:2007.12.08

    目录
    一、引子
    二、系统配置
        1、原理
        2、实战
            繁体中文配置
            日文配置
            韩文配置
            简体中文配置
    三、其他讨论

    一、引子

    在简体中文Office 2003下用Micorsoft Office Document Imaging (MODI)做OCR的步骤为:

    先确保MODI已经正常安装。Office 2003的缺省安装是第一次使用MODI时安装,Office 2007的缺省安装是不装,都需要改过来。
    在资源管理器里选中某个多页TIFF文件,从右键菜单选择用Micorsoft Office Document Imaging打开。
    打开后,先选择“工具->选项”,对OCR选项进行设置。常规设置是去掉“自动拉伸”、“自动旋转”选项,再选择合适的语言。
    选择“工具->将文本发送到Word”,在弹出的对话框中选择“所有页面”,“在输出时保持图片版式不变”,然后选择默认文件夹,点“确定”,即可开始OCR。
    OCR结束后,文本自动发送到Word。缺省格式是HTML,当然也可以另存为txt、doc。
    与其他商业OCR软件相比,MODI具有下列特点:

    支持多页TIFF。某些OCR只支持单页TIFF,OCR以后还需要对结果进行合并。当然MODI支持的TIFF页数也不是无限的,我个人的经验是不要超过300页。单页TIFF文件可以用免费的TiffToy合并成多页TIFF,然后再用MODI进行OCR。TiffToy合并时可以选择每合并多少个文件生成一个新文件。
    中文标点、文本段落保持得比较好,后期校对省了很多事。
    支持的语言比较多,Office支持的语言基本都支持。但是这一点对大多数用户来说无法体会,因为正常情况下,MODI只支持英文和当前Office语言(如简体中文)的OCR,要想支持更多的语言,需要进行一些设置,这就是本文所要讨论的内容。当然我并非语言天才,对于亚洲主要语言(中、日、韩)还算有所了解,其他语言一概无知,所以本文的讨论也仅限于这三国语言。
    提供开放的编程接口。对于软件开发人员来说,到微软网站下载一份MODI编程手册,即可开发出基于MODI的、具有多国语言OCR功能的软件。
    在正式开始讨论系统设置前,先透露一点技术背景:

    MODI所使用的中、日、韩OCR引擎,均为清华文通的OCR引擎。
    由于简体中文平台的GBK字符集完全覆盖繁体中文、日文,因此繁体中文、日文的OCR结果在简体中文Office环境下均为GBK编码,可以在支持GBK编码的中文平台下正常显示、编辑。当然如果觉得繁体中文看起来比较麻烦,也可以用Word的繁简转换功能,或TextForever的编码转换功能,将GBK繁体转换成GB编码的简体。但是对于韩文来说就没有这么美好了,因为目前GBK还不兼容韩文,所以韩文的OCR结果如果想在简体Office下编辑,大概只能存为HTML或doc文件,然后用Word编辑。
    MODI编程手册可以到这里下载:
    http://www.microsoft.com/downloa ... &displaylang=en
    二、系统配置

    1、原理

    要想让简体中文Office 2003能够OCR繁体、日文、韩文,需要做的工作包括两个方面:

    安装相关语言的OCR模块。MODI本身可以看作一个外壳,真正的OCR功能需要靠不同语言的模块实现。每个语言模块包括相关DLL文件和数据文件,需要复制到MODI的安装文件夹下。
    告诉MODI,目前有哪些语言的OCR模块可以使用。这个需要更改注册表,更改后在MODI的OCR选项里即可选择对应的语言。
    2、实战

    繁体中文配置

    找一台安装了繁体中文Office 2003的机器,进入MODI的安装文件夹,缺省为:

    C:\Program Files\Common Files\Microsoft Shared\MODI\11.0

    将下面的文件复制到安装了简体中文Office 2003的相同文件夹下:

    TCCODE.UNI
    TCPRINT.DAT
    TCPRINT2.DAT
    TCSERHT.DAT
    TCTREE.DAT
    TW_BU.DAT
    TW_UB.DAT
    TWBIG532.DLL

    复制完成后,用记事本创建一个reg文件,把下面内容粘贴后存盘:

    Windows Registry Editor Version 5.00

    [HKEY_CURRENT_USER\Software\Microsoft\Installer\Components\61BA386016BD0C340BBEAC273D84FD5F]
    "1028"=hex(7):28,00,26,00,48,00,42,00,56,00,6e,00,2d,00,7d,00,66,00,28,00,5a,\
    00,58,00,66,00,65,00,41,00,52,00,36,00,2e,00,6a,00,69,00,4f,00,43,00,52,00,\
    5f,00,31,00,30,00,32,00,38,00,3e,00,7d,00,60,00,45,00,4d,00,61,00,65,00,2c,\
    00,37,00,71,00,39,00,2a,00,44,00,58,00,64,00,55,00,40,00,45,00,50,00,69,00,\
    3d,00,00,00,00,00

    双击此reg文件导入注册表后,在MODI的OCR选项卡里,“OCR语言”即可看到“中文(繁体)”。注意导入注册表时必须先关闭所有MODI窗口,导入后再打开。

    在简体中文环境下,按照上述步骤设置后,用MODI识别出来的繁体中文是GBK编码的繁体字,可以用Word的繁简转换,或TextForever的编码转换功能 (支持批量)转换成GB编码的简体字。

    日文配置

    需要从日文MODI复制到简体MODI文件夹下的文件为:

    JPCODE.UNI
    JPPRINT.DAT
    JPPRINT2.DAT
    JPSERHT.DAT
    JPTREE.DAT
    TW_SU.DAT
    TW_US.DAT
    TWRECJ.DLL
    TWSJIS32.DLL

    需要导入的reg内容为:

    Windows Registry Editor Version 5.00

    [HKEY_CURRENT_USER\Software\Microsoft\Installer\Components\61BA386016BD0C340BBEAC273D84FD5F]
    "1041"=hex(7):30,00,5d,00,67,00,41,00,56,00,6e,00,2d,00,7d,00,66,00,28,00,5a,\
    00,58,00,66,00,65,00,41,00,52,00,36,00,2e,00,6a,00,69,00,4f,00,43,00,52,00,\
    5f,00,31,00,30,00,34,00,31,00,3e,00,2e,00,61,00,45,00,4d,00,61,00,65,00,2c,\
    00,37,00,71,00,39,00,2a,00,44,00,58,00,64,00,55,00,40,00,45,00,50,00,69,00,\
    3d,00,00,00,00,00

    配置成功后,在MODI的OCR选项卡里,“OCR语言”即可看到“日语”。

    在简体中文环境下,按照上述步骤设置后,用MODI识别出来的日文是GBK编码,可以在支持GBK字符集的简体中文环境下正常显示、编辑。

    韩文配置

    需要从韩文MODI复制到简体MODI文件夹下的文件为:

    DATASIM.DAT
    HANGULLB.DAT
    KRCODE.UNI
    KRDIST.DAT
    KRPRINT.DAT
    KRSERHT.DAT
    KRTREE.DAT
    TW_KU.DAT
    TW_UK.DAT
    TWCUTCKR.DLL
    TWCUTLKR.DLL
    TWKSC32.DLL
    TWLAYKR.DLL
    TWRECK.DLL

    需要导入的reg内容为:

    Windows Registry Editor Version 5.00

    [HKEY_CURRENT_USER\Software\Microsoft\Installer\Components\61BA386016BD0C340BBEAC273D84FD5F]
    "1042"=hex(7):31,00,5d,00,67,00,41,00,56,00,6e,00,2d,00,7d,00,66,00,28,00,5a,\
    00,58,00,66,00,65,00,41,00,52,00,36,00,2e,00,6a,00,69,00,4f,00,43,00,52,00,\
    5f,00,31,00,30,00,34,00,32,00,3e,00,30,00,61,00,45,00,4d,00,61,00,65,00,2c,\
    00,37,00,71,00,39,00,2a,00,44,00,58,00,64,00,55,00,40,00,45,00,50,00,69,00,\
    3d,00,00,00,00,00

    配置成功后,在MODI的OCR选项卡里,“OCR语言”即可看到“朝鲜语”。

    在简体中文环境下,按照上述步骤设置后,用MODI识别出来的韩文是韩文编码(charset:129),可以存为HTML、doc,并能在Word里正常显示、编辑。如果存为TXT,则不能在简体中文环境下显示、编辑。

    简体中文配置

    如果需要在繁体中文环境下OCR简体中文,最正宗的方法是下载、安装一个简体MODI:

    http://www.microsoft.com/downloa ... p;displaylang=zh-tw

    当然如果想省事,也可以复制下列文件:

    SCCODE.UNI
    SCPRINT.DAT
    SCPRINT2.DAT
    SCSERHT.DAT
    SCTREE.DAT
    TW_GU.DAT
    TW_UG.DAT
    TWGB32.DLL

    需要导入的reg内容为:

    Windows Registry Editor Version 5.00

    [HKEY_CURRENT_USER\Software\Microsoft\Installer\Components\61BA386016BD0C340BBEAC273D84FD5F]
    "2052"=hex(7):4d,00,6a,00,33,00,47,00,51,00,66,00,5e,00,62,00,54,00,3f,00,42,\
    00,3f,00,56,00,50,00,24,00,5e,00,62,00,53,00,6c,00,6c,00,3e,00,25,00,6d,00,\
    45,00,4d,00,61,00,65,00,2c,00,37,00,71,00,39,00,2a,00,44,00,58,00,64,00,55,\
    00,40,00,45,00,50,00,69,00,3d,00,00,00,00,00

    三、其他讨论

    详见《用Pdg2Pic、TextForever实现批量OCR》。

    评分

    1

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-11-13 22:24
  • 签到天数: 186 天

    [LV.7]常住居民III

    发表于 2008-4-27 12:50 | 显示全部楼层
    读书园地wolfeyes 兄提供繁体中文、日文、韩文、简体中文OCR引擎,我也把它下载地址贴出来,供大家使用。
    繁体中文识别
    匿名提取文件连接:http://pickup.mofile.com/6586690247092923
    日文识别
    匿名提取文件连接:http://pickup.mofile.com/3450460086308631
    韩文识别
    匿名提取文件连接:http://pickup.mofile.com/0440810023559326
    简体中文识别
    匿名提取文件连接: http://pickup.mofile.com/2008820428172679

    评分

    2

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-8-25 22:01
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2008-4-27 14:42 | 显示全部楼层
    多谢老马兄奉献新软件,say兄热情讲解,提供连接。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2008-4-27 15:00 | 显示全部楼层
    老马自己来发独角兽了,先给你顶上再致谢。
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条

    Archiver|手机版|小黑屋|国学数典 ( 2006-2019 冀ICP备19008975号-2 )

    GMT+8, 2019-4-20 21:14

    Powered by Discuz! X3.4

    © 2001-2017 Comsenz Inc.

    快速回复 返回顶部 返回列表