国学数典

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 56107|回复: 596

[工具] 汉文博士 0.5.3.2099 支持生僻古难字的开放式电子辞典

    [复制链接]

该用户从未签到

发表于 2012-1-21 21:12 | 显示全部楼层 |阅读模式
本帖最后由 汉文学士 于 2014-9-2 22:56 编辑

原用 BabelMap 查汉字读音,颇感不便,遂自行整理 Unihan 数据,开发了这个查询工具。经过一年多的开发,此工具除了可检索汉字数据之外,还可以查询汉语词语的解释。

《汉文博士》(原名《汉字速查》)是一个免费的开放式汉语字词典检索工具,可以查询统一码收录的七万个汉字的资料。
  • 电子词典、字典检索功能。
  • 使用部首笔画、国语拼音、广东话粤拼、汉字部件组合、内码输入等方式检索汉字,可用于输入难检字、生僻字。
  • 集成可扩展的字典和词典功能(现有康熙字典、说文解字、Unihan、CC-CEDICT 等字词典数据库),可用于查询汉字词的读音和释义。
  • 开放式数据结构,使用者可自由从各种文本文件编译生成词典数据库。
  • 音韵检索功能可用于检索同音字、同韵字。
  • 字典查询结果带有超级连接,可在相关汉字之间灵活跳转。
  • 独创关联词语检索功能,可在类似的词条之间相互参照,扩展汉语词汇。
  • 汉语文本排序。
  • 简体、繁体汉字文本相互转换。
  • 导出字库文字为图片文件的功能。
绿色软件,解压即用,永不过期。
官方网站是:http://hanbox.cnblogs.com。该网站上有软件的使用方法说明,以及字词典数据库下载连接。

运行环境:
程序需要 .NET Framework 2.0 才能运行。
生僻汉字需安装相应的字库才能显示,推荐安装花園明朝字库或海峰的 UniFonts 6.0 字库。

添加字典(词典)的方法:安装应用程序,下载并解压字典压缩包的 hzd 文件到硬盘,然后在“词典”菜单选择“管理词典及更改程序选项”,在弹出对话框的“已安装字词典”选项卡中点击“添加”按钮,添加数据库文件。取消词典左边的方框可屏蔽该词典。上下拖动项目可改变其在查询窗口的显示顺序。

注:
汉字数据源于统一码汉字数据(Unihan)及汉字数据库(Kanji Database)。
构形数据库的数据源于台湾中央研究院,作了少量微调。
康熙字典的数据库来自汉典论坛(http://bbs.zdic.net/thread-122014-1-1.html
  1. 0.5.3.2088 2014年7月18日
  2. 新增功能:
  3.     更新统一码数据库为 7.0。
  4.     增加汉字笔画数偏好选项。
  5.     词典编译器增加检查词条是否以标点符号结尾(检测不完整内容)的选项。
  6.     简繁体、异体字转换。
  7.     汉字文本排序。
  8.     选中单个汉字时显示该汉字的简繁变体和读音。
  9.     修改词条列表字体尺寸的选项。
  10.     打开程序后马上显示启动界面,改善使用体验。
  11.     “每日一字”功能。
  12.     构形输入法支持区块筛选。
  13.     自动复制检索内容的选项。
  14.     程序菜单增加下载词典数据库和访问词典主页的命令。
  15. 修改功能:
  16.     程序加载器检测 .NET Framework 2.0~4.0 是否安装。
  17.     程序自动检测基础数据库是否存在。
  18.     发行版中附带了汉字表。
  19.     查询结果中的拼音字段使用拉丁字母显示,并生成音节检索超链接。
  20.     查询结果中的粤拼字段生成音节检索超链接。
  21. 修复错误:
  22.     在检字窗口复制的字体没有按显示顺序排序。
  23.     未能正确加载默认值的问题。
  24.     在输入文件包含很少词条的情况下,词典编译器会写入错误的词条索引,导致词条不在检索结果列表显示。
  25.     检索包含不完整复码文本时程序崩溃的问题。
  26.     词典编译器写入多余字段的问题。
复制代码

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

点评

汉字速查 0.3.1 版怎么不见附件?  发表于 2012-6-23 10:39

评分

1

查看全部评分

回复

使用道具 举报

该用户从未签到

发表于 2013-7-2 10:19 | 显示全部楼层
我是在试验,看看这里能不能显示这个字,结果是我输了,但这里没显示,这个就太业余了,连我的老版QQ都可以完美显示大字集的
回复 支持 0 反对 1

使用道具 举报

该用户从未签到

 楼主| 发表于 2012-1-21 21:14 | 显示全部楼层
本帖最后由 comme 于 2012-12-28 09:59 编辑

已知问题:
统一码数据本身有错误,生成数据库时未作纠正。
尚未找到自动检测字库覆盖汉字的方法,可能需要手工指定显示汉字区域的字库。

安装字典步骤(适用于 0.4 版):
  • 下载本贴附件,将其解压到程序安装目录下的“database”目录;
  • 启动程序;
  • 点击“选项”按钮;
  • 在弹出的选项对话框中,点击“自动安装”按钮,并确认弹出的对话框。

可到此下载更多词典
回复 支持 反对

使用道具 举报

  • TA的每日心情
    慵懒
    2019-4-18 14:21
  • 签到天数: 470 天

    [LV.9]以坛为家II

    发表于 2012-1-22 09:13 | 显示全部楼层
    极好的新年礼物,深谢。
    请问如何查找”䙴“(“遷”字所从)。能不能加进输入一个字,而予以折分的功能。比如输入“遷”而得到”䙴“?

    点评

    好像日本人的《文字镜》有这个功能。我也想有这个功能,但是没有文字数据库。如有人可以提供拆分文字的数据,我可以将其做到软件中。  发表于 2012-1-22 19:58
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-18 15:58
  • 签到天数: 396 天

    [LV.9]以坛为家II

    发表于 2012-1-22 11:31 | 显示全部楼层
    好东西,希望不断完善,能查到的字越多越好。

    点评

    现在程序支持的是统一码最新标准,已经可以查询该标准包含的所有七万多个汉字了。  发表于 2012-1-22 19:59
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2018-9-19 19:34
  • 签到天数: 111 天

    [LV.6]常住居民II

    发表于 2012-1-22 11:58 | 显示全部楼层
    感谢楼主
    提个建议:
    几个有检索页码的字典根本得不到:不但无电子版,且无售,
    因此相关的几个条目似乎可以去掉

    点评

    的确如此。我也有计划做个精简版缩减数据库。  发表于 2012-1-22 20:00
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2019-4-18 14:21
  • 签到天数: 470 天

    [LV.9]以坛为家II

    发表于 2012-1-23 08:59 | 显示全部楼层
    多谢回复。
    efeditor好象也算有拆字这个功能。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2017-3-5 20:46
  • 签到天数: 240 天

    [LV.8]以坛为家I

    发表于 2012-1-23 18:21 | 显示全部楼层
    jianbo06 发表于 2012-1-23 08:59
    多谢回复。
    efeditor好象也算有拆字这个功能。

    试试漢字構形資料庫(台湾繁体版,需繁体WINXP,需安装,200MB),这个字形拆分合并功能很好用哦!

    评分

    1

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2019-4-18 14:21
  • 签到天数: 470 天

    [LV.9]以坛为家II

    发表于 2012-1-23 20:15 | 显示全部楼层
    谢谢fqma 。下载试试看。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-1-24 10:35 | 显示全部楼层
    fqma 发表于 2012-1-23 18:21
    试试漢字構形資料庫(台湾繁体版,需繁体WINXP,需安装,200MB),这个字形拆分合并功能很好用哦! ...

    感謝提供此信息,似乎非常有用,必是統一漢字的有益補充,我去下載一個看看。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-1-24 22:15 | 显示全部楼层
    本帖最后由 comme 于 2012-1-24 22:28 编辑
    fqma 发表于 2012-1-23 18:21
    试试漢字構形資料庫(台湾繁体版,需繁体WINXP,需安装,200MB),这个字形拆分合并功能很好用哦! ...


    剛才分析了一下該數據庫,帶有統一碼資料的構形字體資料有六萬六千多字。
    但我看其數據用於拆分字輸入查找漢字資料的話,還只能算是差強人意。
    一些字符如能再細拆為常用輸入部件,則更加方便。有些拆分的部件很不容易輸入,甚至是在統一碼中不存在的字符。不知道他們為什麽不從實際應用出發,拆分出一些容易輸入的部件來構字。也許這樣有違其學術初衷罷?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-18 15:58
  • 签到天数: 396 天

    [LV.9]以坛为家II

    发表于 2012-1-25 08:13 | 显示全部楼层
    扩展C、扩展D的字复制到WORD后不能显示,这是为什么?系统已安装unifonds6.0。烦请楼主解释一下原因。

    点评

    確有此問題。以後會修復。  发表于 2012-1-25 21:55
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-1-26 17:21 | 显示全部楼层
    本帖最后由 comme 于 2012-1-27 12:48 编辑

    今天发布一个小补丁,修复如下问题:
    部首及读音查询窗口遮挡主窗口;
    三字节统一码汉字复制到Word之后变成问号。
    此外,优化了部分界面的使用体验。增加了跳转到相关变体字符和字符查询历史的功能。
    请下载顶楼程序补丁覆盖旧版程序。
    之前没有下载数据库的,请下载顶楼两个文件,先解压大的压缩包,解出其中数据文件,然后解压小压缩包的程序文件到相同目录。

    评分

    1

    查看全部评分

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-1-29 11:47 | 显示全部楼层
    新年礼物好东西,谢谢谢。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-3-9 10:05
  • 签到天数: 30 天

    [LV.5]常住居民I

    发表于 2012-1-30 07:00 | 显示全部楼层
    這個工具用來查字典真是太妙了,等於做好了部首表,若能把已經有人做了光盤版的故訓匯纂和中文大辭典加進來就更妙了

    点评

    是呀,不知道哪里有汉字释义数据库。要是有的话可以加进程序里面。  发表于 2012-4-2 13:26
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-2-4 12:00 | 显示全部楼层
    本帖最后由 comme 于 2012-2-4 12:02 编辑

    今天更新的 0.2 版新增了汉字构形检索方式(见楼顶屏幕截图),先凑合着用用罢。
    另,读音检索方式在每字下增加显示读音拼式;部首笔画检索增加显示字体除部首外笔画数。


    已知问题:
    尚未实现异体字通查(例如“马”和“馬”为简繁异体字)。
    尚未实现递归检索(例如繁可拆分为“敏”和“糸”,而“敏”可再拆分为“每”和“文”,输入“每”或“文”应能找到“繁”字,目前还不可以)。
    查询出的汉字资料未显示构形数据。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-18 15:58
  • 签到天数: 396 天

    [LV.9]以坛为家II

    发表于 2012-2-4 16:47 | 显示全部楼层
    comme 发表于 2012-2-4 12:00
    今天更新的 0.2 版新增了汉字构形检索方式(见楼顶屏幕截图),先凑合着用用罢。
    另,读音检索方式在每字下 ...

    扩展C、扩展D的字复制到WORD后不能显示的问题仍然没有解决。

    点评

    复制到word之后,你要为该字符选择适当的字体才能显示出来,否则就只能看到一个框。  发表于 2012-2-4 17:34
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-18 15:58
  • 签到天数: 396 天

    [LV.9]以坛为家II

    发表于 2012-2-4 19:50 | 显示全部楼层
    young 发表于 2012-2-4 16:47
    扩展C、扩展D的字复制到WORD后不能显示的问题仍然没有解决。

    我选了所有可能的字体,都不能显示,比如“木+灰”这个字,该用什么字体呢?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-18 15:58
  • 签到天数: 396 天

    [LV.9]以坛为家II

    发表于 2012-2-6 07:39 | 显示全部楼层
    comme 发表于 2012-2-4 12:00
    今天更新的 0.2 版新增了汉字构形检索方式(见楼顶屏幕截图),先凑合着用用罢。
    另,读音检索方式在每字下 ...

    我选了所有可能的字体,扩展C、扩展D 的字WORD中都不能显示,比如“木+灰”这个字,该用什么字体呢?

    点评

    选中无法显示的字符,然后在其上点鼠标右键,在弹出菜单中选“字体”,将中英文字体皆改成Sun-ExtB.  发表于 2012-2-6 13:33
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-3-31 21:40 | 显示全部楼层
    更新到0.2.1版:
    优化了查字界面。
    更新数据库为统一汉字6.1数据库。

    点评

    感谢大侠更新  发表于 2012-3-31 23:03
    统一码6.1版已于本年一月发布,但目前尚未见支持该版本的字库。  发表于 2012-3-31 21:44

    评分

    1

    查看全部评分

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-4-1 00:37 | 显示全部楼层
    謝謝大俠,生命在于折騰
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-4-1 18:47 | 显示全部楼层
    endnote 发表于 2012-4-1 00:37
    謝謝大俠,生命在于折騰

    谢谢!
    有人建议将离线《汉典》的内容做成可查询内容。
    可惜目前没时间,要是有人能帮助做个这样的数据库就好了。

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-18 15:58
  • 签到天数: 396 天

    [LV.9]以坛为家II

    发表于 2012-4-4 10:35 | 显示全部楼层
    win7-64位下“构形”检字不能用,请大侠注意一下。

    点评

    扩展A、B有些检索不到,如“木+石+木”。扩展C、D都检索不到。  发表于 2012-4-5 07:52
    基本汉字可以检索,扩展部分检索不到。大家用此软件主要是想检索扩展部分。  发表于 2012-4-5 07:39
    在构形检字中输入一个字,例如“人”,也无法检索出结果么?  发表于 2012-4-4 16:17
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-4-5 08:56 | 显示全部楼层
    本帖最后由 comme 于 2012-4-5 09:00 编辑
    young 发表于 2012-4-4 10:35
    win7-64位下“构形”检字不能用,请大侠注意一下。

    是检索算法的问题,近来正在着手改善算法。
    新版本将加强递归检索的能力。
    中央研究院的数据库尚未完全覆盖统一汉字区域,因此有些汉字无法检索——特别是扩展C和扩展D区,只好用部首笔画检索了。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2017-4-19 18:10
  • 签到天数: 38 天

    [LV.5]常住居民I

    发表于 2012-4-15 13:38 | 显示全部楼层
    在繁體系統下此軟體可以正常操作那感覺真好,感謝

    点评

    感谢反馈!  发表于 2012-4-15 19:55
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-4-16 03:40 | 显示全部楼层
    很好用的工具,感謝提供。
    茝字用构形检索不到(艹匚,或许这一组合不智),用部首艹,按笔画可找到,较费时。传统上艹归艸部。而用艸部搜索,只见艸部古字,不见艹部常用字,是否可来次革命,将艹移入三画类。另外,用笔画找部首实在很落后,是否可兼用拼音法(比如艹:cao)。数字法(比如艹:122)等方法。
    构形的检索按钮可否免去,随输入随检索。
    构形的输入框的初始状态是西文,每次进入皆需按一次shift(搜狗输入),但愿是我的个例。

    点评

    构形输入框初始状态是西文。开启输入法后,关闭了构形对话框重新再打开,应该会维持输入法中文状态(构形检索窗口实际没关,只是隐藏而已)。  发表于 2012-5-21 19:02
    这位同学提的意见很好。我已经实现用读音筛选部首的功能了,的确爽了不少!请等待下个版本。  发表于 2012-5-21 19:00
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-4-16 04:06 | 显示全部楼层
    躧:查【足麗】【麗】不果。查【麗】可得。技巧之一:不必全部輸入构件,捡其要者,事半功倍。

    点评

    构形数据库是台湾研究者做的,有些部件(如“足”字部)居然用了私用字符来做部件,无法输入,下个版本会尝试兼容“足”、“”与其私用部件  发表于 2012-4-16 09:06
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-4-16 08:55 | 显示全部楼层
    本帖最后由 comme 于 2012-4-16 09:03 编辑
    QmimQ 发表于 2012-4-16 03:40
    很好用的工具,感謝提供。
    茝字用构形检索不到(艹匚,或许这一组合不智),用部首艹,按笔画可找到,较费 ...

    感谢您的回复。
    我在下一版本会加强构形检索的功能,支持异体偏旁的检索,即“艹”通“艸”,“刂”通“刀”。
    部首检索的确需要增强,综合检索的建议不错哈,但是没这么快能做出来,我想想应该如何实现。

    下一个版本会开放汉字数据库格式。
    希望有更多的网友可以提供汉字数据库,这样就可以让大家制作并交流字典,集合众人之力做个完善的汉字检索工具。

    评分

    1

    查看全部评分

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-4-16 13:24 | 显示全部楼层
    Thank you a lot! 多谢多谢!
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-4-17 00:27 | 显示全部楼层
    本帖最后由 QmimQ 于 2012-4-17 08:16 编辑

    越用越好用,好話说不尽就不说了,只把有一处不便强调一下,即构件输入框无记忆功能,能否赐她十条记忆(当然一旦具备此功能,又会跌入不说处)。

    又:好像漏了【夒】

    点评

    “夒”的部件居然是“止頁巳夊”  发表于 2012-4-17 09:36
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-4-17 09:44 | 显示全部楼层
    本帖最后由 comme 于 2012-4-17 11:02 编辑
    QmimQ 发表于 2012-4-17 00:27
    越用越好用,好話说不尽就不说了,只把有一处不便强调一下,即构件输入框无记忆功能,能否赐她十条记忆(当 ...

    如果是输入后自动查询,可能会在历史记忆将会有多条记录。
    例如输入部件:“心至”。先输入“心”时,自动查询一次,会记录一个输入记录;然后等你再输入“至”时,自动查询,又会记录一个历史记录,那么将有“心”和“心至”两条历史记录,而第一条可能是你不需要记录的。
    我在新版本里这样设定:
    输入两个部件起可自动检索,但不保存部件历史记录,只有按“检索”按钮执行检索的,才会保存历史记录。


    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x

    评分

    1

    查看全部评分

    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条

    Archiver|手机版|小黑屋|国学数典 ( 2006-2019 冀ICP备19008975号-2 )

    GMT+8, 2019-4-19 10:54

    Powered by Discuz! X3.4

    © 2001-2017 Comsenz Inc.

    快速回复 返回顶部 返回列表