国学数典

 找回密码
 注册

QQ登录

只需一步,快速开始

楼主: 汉文学士

[工具] 汉文博士 0.5.3.2099 支持生僻古难字的开放式电子辞典

    [复制链接]

该用户从未签到

 楼主| 发表于 2012-8-30 12:03 | 显示全部楼层
新版本已经上传。新增模糊词条检索功能,欢迎试用。

点评

感谢。非常感谢。  发表于 2012-8-30 21:09
回复 支持 反对

使用道具 举报

  • TA的每日心情
    开心
    2019-12-7 22:14
  • 签到天数: 743 天

    [LV.9]以坛为家II

    发表于 2012-8-30 16:11 | 显示全部楼层
    已下载试用!我上次试用0.40版时检索词典不显示结果的问题已解决,各项检索功能正常。我是电脑方面的菜鸟,只能说声谢谢!谢C兄辛苦开发出惠及网友的好软件!顺便说声我用的操作系统是XP的。

    点评

    太好了,感谢您的反馈。  发表于 2012-8-30 16:37
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-8-30 18:46 | 显示全部楼层
    QmimQ 发表于 2012-8-30 07:53
    ◎【排序方式】中各方式的排序是否可由用戶自定。比如我想定【笔画】为缺省值。
    ◎ 本软件是否能再开发一个 ...

    目前异体通查算法的性能还不行,检索词条的异体字多了,性能就比较差,检索一些比较长的词条就会发现这个问题。
    我正在想办法解决。

    点评

    只能检索词典,不支持检索硬盘文件。  发表于 2012-8-31 09:05
    可否先支持local搜索如c盘u盘之类。  发表于 2012-8-30 21:12
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-9-3 11:42 | 显示全部楼层
    0.4.2 新版本的汉字速查新增功能:
        保存和加载词典组。
        词条模糊检索增加按相似度排序的功能。
        可自定义何时执行词条的模糊检索。
        打开程序后,默认显示的检索选项卡为上次选定的选项卡。
    修改功能:
        大幅提高长词语的异体通查检索算法。
        支持检索词语长度增加到 31 字。

    欢迎试用。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-12-12 08:00
  • 签到天数: 1203 天

    [LV.10]以坛为家III

    发表于 2012-9-3 18:44 | 显示全部楼层
    还有一个不方便的地方:先后查了几个字(或词),想回头去复制先前查到的字(或词),还要重查。缺少一个“返回”按钮。《汉语大词典》(电子版)就有这种功能。

    点评

    现在没有《汉语大字典》的数据库。:( 提示:Unihan 数据库中有汉语大字典的页码检索。如“汉语拼音(汉语大字典)JIE2, (10367.120:jié)”=10卷367页第120字  发表于 2012-9-5 12:37
    谢谢提醒。比电子版《汉语大词典》方便。词典中再加入《汉语大字典》就更好了。  发表于 2012-9-4 08:47
    在查询结果界面点右键菜单,选择“切换”会在最近查的两个字词间切换。检索历史功能以后会继续优化的。  发表于 2012-9-4 06:44
    请点击工具栏的“历史”按钮,然后在弹出的菜单项中选择之前查过的字词。  发表于 2012-9-4 06:39
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2019-10-23 12:33
  • 签到天数: 113 天

    [LV.6]常住居民II

    发表于 2012-9-4 00:40 | 显示全部楼层
    兄的软件功能越来越强大了。我的试用心得:台湾国语辞典错字比较多。如说文解字注一条:
    书名。清段玉裁撰,为清代研究说文重要作之一。段氏首先根据说文体例和宋以前群书所引说文辞句校补其讹脱,以求恢复其原貌。再用古书上所用字义,以阐明说文的说解和一字多义的由来。创通条例,系联音韵和训诂,对汉字研究贡献卓。此书引证浩博,考订精确,惟改动原文,增删篆文,不免有武断之处。后(六)书音均表五篇,依诗经用韵和谐声,分古韵为六魏(十)七部,为古音学重要作。说文解字注中每篆下所注古韵部,大都依此而定。
    其中除著—着属于繁简转换讹误外,其余皆系错误。
    另外的问题:
    一、词典检索时繁简词典都有的此条,分别以简体字和繁体字显示一次,比较不醒目;
    二、繁体词典内容显示为简体,容易出错,建议保持繁体显示。简体词典亦保持原状,因为简转繁也容易错误。
    可能软件中暗含解决机制,弟未能发现,若如此,还请指出。

    点评

    一、我也觉得不爽,正在想办法解决这个问题;二、源文件就是这个样子,不是我将它转简体的。要是有该词典繁体版本的话,我会重新制作一个。  发表于 2012-9-4 06:41
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-9-4 01:08 | 显示全部楼层
    非常好,下载了。 非常感谢!
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-9-6 10:25 | 显示全部楼层
    0.4.3.507 2012年9月6日
    新增功能:
            可自定义查询结果正文的字体。
    修改功能:
            词条模糊检索列表合并了简繁异写词(取简体还是取繁体,要视词条在词典出现顺序而定)。
            优化词条模糊检索的相似度算法。
    修复错误:
            异体通查检索可能返回错误词语的问题。
            无法记住执行词条模糊检索的选项。

    点评

    扩展C区、扩展D区、兼容汉字和兼容扩展区的汉字是否能在Win7系统中软件能正常显示,但复制到word时只是一个框,选了sun-extrB也不行。  发表于 2012-9-9 20:26
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-11-17 18:55
  • 签到天数: 120 天

    [LV.7]常住居民III

    发表于 2012-9-7 11:24 | 显示全部楼层
    《汉字大字典》的word版谁共享出来,让comme兄编进汉字速查,那该多好啊。

    点评

    现在还没有《汉语大字典》的文字版吧?  发表于 2012-9-7 12:00
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    难过
    2019-12-12 14:40
  • 签到天数: 466 天

    [LV.9]以坛为家II

    发表于 2012-9-9 20:45 | 显示全部楼层
    扩展C、B的字复制到word时无法显示,选了sun-extB字体也不行,但记事本中能够显示,不知这是为什么?

    点评

    好像以前在WinXP上已解决过这个问题了,现在又重复出现。真是怪了。  发表于 2012-9-9 23:16
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-9-14 19:21 | 显示全部楼层
    本帖最后由 hughman 于 2012-9-14 19:26 编辑

    问楼主几个问题:
    1)表意文字序列数据库是不是跟构形数据库差不多的?
    2)unihan数据库中国语读音是不是指台湾读音?
    3)unihan精简版跟完整版什么区别,我查了几个字怎么感觉都一样的?
    4)建议部首检索中,简化的部首也按比划列出来,如果我不知道阝邑是同一个部首,找起来有点麻烦
    5)建议加一个返回按钮,或者鼠标的前进后退键能像在网页浏览器中一样起作用
    6)什么叫Z异体字?自定义?
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-9-14 19:47 | 显示全部楼层
    本帖最后由 comme 于 2012-9-14 19:53 编辑
    hughman 发表于 2012-9-14 19:21
    问楼主几个问题:
    1)表意文字序列数据库是不是跟构形数据库差不多的?
    2)unihan数据库中国语读音是不是指 ...
    问楼主几个问题:
    1)表意文字序列数据库是不是跟构形数据库差不多的?
    2)unihan数据库中国语读音是不是指台湾读音?
    3)unihan精简版跟完整版什么区别,我查了几个字怎么感觉都一样的?
    4)建议部首检索中,简化的部首也按比划列出来,如果我不知道阝邑是同一个部首,找起来有点麻烦
    5)建议加一个返回按钮,或者鼠标的前进后退键能像在网页浏览器中一样起作用
    6)什么叫Z异体字?自定义?

    1、根据我的分析,表意文字描述序列(Ideograph Description Sequence)数据库有一部分借鉴了台湾中央研究院的构形数据库(两者具有雷同的私用部件可以证明这一点)。前者经过这几年的发展,包含的字符更多。此外,在汉字写法上,还包含大陆、日本、韩国、港澳等地的写法。台湾中央研究院的构形数据库,除了汉字部件数据之外,还包含了一个非常丰富的异体字数据库、还有一些字典和词典的索引、各种书体的写法及字库等。
    2、目前我没有研究过统一汉字数据库的普通话读音(Mandarin)是否为台湾读音。从之前某位网友给出的一个示例来看,有可能是。
    3、Unihan 完整版包含了许多字段(例如一些大型词典的索引、韩日越字读音、仓颉码数据等)。这些字段在默认状态是隐藏的,你可以点击检索页面的字典名称(加了下划线的黑体“Unihan”),在弹出的对话框中勾选你希望显示的字段,然后重新检索就能看到新勾选的字段检索结果了。
    4、接受建议。《康熙字典》部首对于没有接触过传统字典的使用者而言,的确有点门槛。
    5、接受建议。目前你可以使用界面上的“历史”按钮在查询历史中跳转。
    6、Z变体在统一汉字数据库中表示字音字义完全相同,但写法不同的变体。你可以参阅其说明:http://www.unicode.org/reports/tr38/#N10211

    谢谢您的反馈。我正在考虑重新改造词典和字典的数据结构,争取在下一版中支持嵌入图片等多媒体数据,并最终确定词典的数据结构。至于上述4、5两个问题,可能不会这么快解决。在确定词典数据结构之后,就会在程序中添加生成词典的功能,让大家可以制作并分享自己喜欢的词典。欢迎您继续提供您的宝贵意见。

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-9-19 11:25 | 显示全部楼层
    我升级到0.4.3后有时候软件启动不了,就是有进程但是GUI出不来
    前面的版本没碰到这个问题,不知道是怎么回事?

    点评

    试试按键盘Alt+Tab键看看是否能把窗口切换出来。我好像也遇到这个问题,暂时还不知道是什么原因导致的。  发表于 2012-9-19 11:45
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-9-26 09:47 | 显示全部楼层
    新的测试版(0.5)会增加一个词典编译器,可以使用词典定义文件把文本文件做成词典数据库。
    目前正在修改词典数据库的格式,待修改完成后,即发布新的测试版。
    我正在考虑是否将词典数据和索引文件分开。这样,以后升级程序版本后,可能可以通过更新索引文件,而不是重新发布词典数据库来实现更多的检索功能;此外,由于索引文件可由词典数据生成,发布较小的词典数据库即可,索引文件可由客户端程序自动生成。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x

    点评

    期待更强、更好的版本!顺祝C兄中秋、国庆双节快乐!  发表于 2012-9-28 09:40
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-9-29 11:51 | 显示全部楼层
    QmimQ 发表于 2012-8-11 11:23
    得寸再进尺。
    许多古字,都是成词,找了前一个还需找第二个。如果搜字出词,也可加快效率。 ...

    今天已在新版本做出“搜字出词”的功能,可以用几种条件过滤筛选模糊检索所得的词条。
    请等待新版本的发布。



    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x

    点评

    用得太舒服了。感谢。另有一个小愿望:所出词条,希望可以整体复制。  发表于 2012-9-30 09:52
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    郁闷
    2019-12-12 06:42
  • 签到天数: 913 天

    [LV.10]以坛为家III

    发表于 2012-9-29 15:13 | 显示全部楼层
    期待新版,并祝comme 中秋佳节快乐!
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-9-29 22:09 | 显示全部楼层
    0.5测试版已经上载到测试区http://sdrv.ms/P1Z8IQ)。
    请在下载任何文件前先阅读该目录下的【下载必读】文档。
    阅读后,如果你不怕麻烦,希望协助测试新版本的话,请继续下载。
    测试版及相关数据库仅供预览新版本的功能,与旧版本完全不兼容,与今后发行的版本也不兼容。请慎重下载。不要覆盖安装到旧版本的位置。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-10-5 17:59 | 显示全部楼层
    本帖最后由 hughman 于 2012-10-5 18:20 编辑

    有个字查不到,土夅,不知道在哪个区,用qq拼音能打出来,但是查询说不是汉字

    点评

    查询说不是汉字的,程序还是会显示该字符的统一码的。你看看那字的统一码是多少。  发表于 2012-10-6 11:19
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-10-7 00:45 | 显示全部楼层
    hughman 发表于 2012-10-5 17:59
    有个字查不到,土夅,不知道在哪个区,用qq拼音能打出来,但是查询说不是汉字 ...

    E0C3              

    点评

    “土夅”未收入统一码统一汉字。E0C3属于统一码里面的私用区。由应用程序保留使用,没有公开的标准。不同的字库还可能在这个区里放置不同的字符  发表于 2012-10-7 10:42
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-6-4 20:37
  • 签到天数: 2 天

    [LV.1]初来乍到

    发表于 2012-10-7 22:52 | 显示全部楼层
    你好!在使用HanziSearcher时总是显示如下提示,不知是何缘故?

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x

    点评

    可能是词典数据库和程序不匹配。请尝试将程序和数据库全部删除,再重新下载。如果搞不掂,请等待新版本。  发表于 2012-10-9 09:09
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-10-21 11:46 | 显示全部楼层
    感谢楼主的辛勤劳动!你的名字将在汉语文化史上占有位置!
    回复 支持 反对

    使用道具 举报

    bisinu 该用户已被删除
    发表于 2012-10-30 11:55 | 显示全部楼层
    提示: 作者被禁止或删除 内容自动屏蔽
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    发表于 2012-11-26 11:12 | 显示全部楼层
    绝好东西,希望楼主及早退出带字典、词典编辑功能的成熟版本。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2019-10-23 12:33
  • 签到天数: 113 天

    [LV.6]常住居民II

    发表于 2012-12-4 20:08 | 显示全部楼层
    楼主,不知道能否增加按照广韵声纽、韵部(且最好可多选)的功能,这个功能对于研究音韵文字训诂的功用可以说是不可估量的。
    另外:《说文》华东师大所开发的单个网页文档可以通过记事本修改内容,自行改正错误或增加信息,如果楼主的软件允许此类内容的自定义修改,就更加完美了。
    可惜本人暂时还不会相关编程,又无时间深入学习,实在惭愧。

    点评

    是否有现成的广韵检索界面可供参考? 为了完善词典的质量,提供修订并共享修订成果的功能是非常必要的。我会在今后的开发中考虑实现此功能。  发表于 2012-12-12 14:24
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2019-10-23 12:33
  • 签到天数: 113 天

    [LV.6]常住居民II

    发表于 2012-12-12 14:51 | 显示全部楼层
    本帖最后由 chonloh 于 2012-12-12 14:58 编辑


    这个是潘悟云版。校勘错误不少,且个别字查不到,如“丙”。
    兄如无精力校订,可尽量设计为可自助修订的软件格式,如您需要,我们这些粉丝随时可以向您反馈此类问题,或到您的博客交流使用心得亦可。

    弟的一个意见是,“韵母”之外,再加一个分声调的韵部。潘悟云直接将平上去整合为一个韵母,很有用,不能取消,但学术界一般是将同韵母的平上去韵直接标出的。

    华东师大《说文》检索界面不错,html文档,可用记事本打开编辑,增加修改信息。且每一个小格都可以搜索特定信息,十分便利。如果广韵能处理成这种格式,就能实现输入一个字,就能找到所有同韵、同韵母字等等,这是小弟学习中最希望实现的功能。如果兄台打算涉及独立于汉字速查软件的新检索系统,弟请兄台能保持从构件查部首,以及查异体等功能,这些功能不是一般的有用。现在汉字速查收字太多,说文、广韵所收字无法分辨出来,信息量太大造成了必要信息被淹没,略感费力

    在此特别致谢:兄台速查软件的许多功能,实在令人叹服。输入构件查含此构件的字,虽然本来是数据库提供了这项可能,但如果没有兄台这样的有心人,使这一功能普惠学人及我等浅学者,我们现在还生活在信息荒漠里,万分感谢!兄台的发明与老马大侠开发的各种傻瓜式图片处理软件,为鄙人的学习研究提供的便利实在无以言表。而兄台之功,则又更加造福于语言文字学界!在希望兄台新发明创造的同时,愚弟甚感惭愧,如兄有需要,愚弟将就其所知,以供驱使

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2019-10-23 12:33
  • 签到天数: 113 天

    [LV.6]常住居民II

    发表于 2012-12-12 16:05 | 显示全部楼层
    本帖最后由 chonloh 于 2012-12-12 16:11 编辑


    上表为个人对框架的设想,供兄参考。
    其中声母、韵母那个大框,只现实的是广韵音。
    显示各家拟音需要支持国际音标的字符集,如兄台需要,我可以提供。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x

    点评

    第一栏中除直接查字外,可采用结果弹出,不然结果无序罗列,且每个结果占据一行,不切实用。谨补记于此  发表于 2012-12-12 16:36
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-12-12 18:03 | 显示全部楼层
    chonloh 发表于 2012-12-12 14:51
    这个是潘悟云版。校勘错误不少,且个别字查不到,如“丙”。
    兄如无精力校订,可尽量设计为可自助修订的软 ...

    广韵原书但有韵部、小韵、反切、字头、注释。潘氏的检索系统字段不少,乃诸家学者归纳而成,不见于原书,不知从何而得。

    阁下所提“自行修订”功能是我之前未考虑到的地方。不知有何法可方便操作且易于实现。

    “输入一个字,就能找到所有同韵、同韵母字等等”之功能,盖可在生成数据库时制作索引条目,如下列《平水韵》截图所示。至于要制作成“粤拼”检索界面的,需另行编程并制作专用数据库,恐一时间难办到。



    “汉字速查收字太多,说文、广韵所收字无法分辨出来”。此问题较易解决。只要列出此二书字头,便可制作字表,在各检索界面将字表的汉字突出显示出来。



    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2019-10-23 12:33
  • 签到天数: 113 天

    [LV.6]常住居民II

    发表于 2012-12-12 20:14 | 显示全部楼层
    说文、广韵字头整理过的人不少,只是难免有个别不合乎预期者。说文检索软件本坛坛友已经有成果,如果不能制成眉目清楚、便于联系它字的软件,实在可以搁置了。
    潘悟云做电子版广韵、集韵,都是一人几页,集合若干人弄的。我原以为只要软件在手,自可尝试解码其原始数据。因为无盈利目的,这样是并无不妥的,相信潘先生也乐于有人整理更好用的东西。奈何此事难度可能非弟之前所想的那样,真是这样,谁也没有那个精力把材料一条条复制出来。(广韵内容我还是了解的,各家拟音暗含着许多观点,放弃实在可惜)。

    自行修订功能,兄台可参考华东师大说文网页。如果不计字体,整个页面只有973K,用记事本打开即可增删内容,我手头的便整合了自己一些笔记,用起来十分方便。

    点评

    嗯,待考试忙完,系统学一下。这个是不是有点返璞归真的意思,呵呵  发表于 2012-12-12 21:20
    只有937K的内容好处理。可以原始文件形式发布数据库。即将原始数据文件与词典编译配置文件放在一起,然后用词典编译工具生成词典,并交换原词库  发表于 2012-12-12 21:17
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2019-10-23 12:33
  • 签到天数: 113 天

    [LV.6]常住居民II

    发表于 2012-12-12 20:42 | 显示全部楼层
    http://ishare.iask.sina.com.cn/f/11449716.html
    这个是华师说文网页文档的下载方式,兄台可以看一下其构思方式。(这个软件不是似乎华师原版,不知道哪位网友做了这个改革,实在比原来强了不啻千百倍)

    我比较不满意这个软件的地方在于它把说文小篆和新附字统一编码,其实照《标点注音说文解字》的原则编号会好得多。通形符的字,输入大搜不出天,之类倒在其次。{:soso_e136:}
    回复 支持 反对

    使用道具 举报

    该用户从未签到

     楼主| 发表于 2012-12-14 17:56 | 显示全部楼层
    本帖最后由 comme 于 2012-12-14 18:05 编辑

    刚才上传了一个骨灰级用户的测试版 0.5.0.675。
    请访问我网志的下载链接,下载“测试版本”文件夹的内容。
    词典数据库为7z文件,请解压到程序database数据库,然后在程序的词典管理界面中点击“自动安装”。
    新版本的数据库格式与旧版不同,请不要覆盖旧版安装。

    因数据库结构尚在设计及优化之中,故尚未开放词典编译器功能。

    点评

    建议楼主发出适用这个测试版的Unihan(完全版)和汉语大词典这两款词典。  发表于 2012-12-15 18:16
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条

    Archiver|手机版|小黑屋|国学数典 ( 2006-2019 冀ICP备19008975号-2 )

    GMT+8, 2019-12-12 22:36

    Powered by Discuz! X3.4

    © 2001-2017 Comsenz Inc.

    快速回复 返回顶部 返回列表