我有两个来自Google Chrome拼写检查程序的BDIC(二进制字典?)文件(基于hunspell)。我想将这两个文件合并为一个单独的BDIC用于所有单词。
以下是来自Chrome来源(LGPL / C ++)的此格式的reader/writer(chromium / src / third_party / hunspell / google / bdict_reader.h)
如何将两个文件与C ++或命令行实用程序结合使用?
答案 0 :(得分:3)
合并两个hunspell词典很简单,有https://github.com/arty-name/hunspell-merge之类的工具可以帮助您将任意数量的源词典合并在一起。
创建Chrome了解的bdict
文件比较棘手。 Chrome使用此格式进行优化,并在内部使用convert_dict
工具将aff
和dic
文件转换为bdict
。我无法在线找到这个工具,所以它只留下一个选项,从Chromium来源构建它。谷歌有一个非常简单的设置,如果仔细执行将让你建立这个工具。首先,您必须按照http://dev.chromium.org/developers/how-tos/get-the-code获取代码并在您的平台上设置环境。之后执行ninja -C out\Debug convert_dict
,如果已完成且没有错误,请在convert_dict
文件夹下找到out/Debug
可执行文件。
您无法向Chrome添加自定义语言(据我所知),因此您必须替换其中一个预定义语言。我建议您安装一些您不理解的语言,并将其用于合并的语言。可以在Chrome用户个人资料文件夹中找到bdict
个文件。