将Chrome(hunspell)中的两个BDIC文件合并为一个

时间:2011-07-30 08:55:04

标签: google-chrome dictionary hunspell

我有两个来自Google Chrome拼写检查程序的BDIC(二进制字典?)文件(基于hunspell)。我想将这两个文件合并为一个单独的BDIC用于所有单词。

以下是来自Chrome来源(LGPL / C ++)的此格式的reader/writer(chromium / src / third_party / hunspell / google / bdict_reader.h)

如何将两个文件与C ++或命令行实用程序结合使用?

1 个答案:

答案 0 :(得分:3)

合并两个hunspell词典很简单,有https://github.com/arty-name/hunspell-merge之类的工具可以帮助您将任意数量的源词典合并在一起。

创建Chrome了解的bdict文件比较棘手。 Chrome使用此格式进行优化,并在内部使用convert_dict工具将affdic文件转换为bdict。我无法在线找到这个工具,所以它只留下一个选项,从Chromium来源构建它。谷歌有一个非常简单的设置,如果仔细执行将让你建立这个工具。首先,您必须按照http://dev.chromium.org/developers/how-tos/get-the-code获取代码并在您的平台上设置环境。之后执行ninja -C out\Debug convert_dict,如果已完成且没有错误,请在convert_dict文件夹下找到out/Debug可执行文件。

您无法向Chrome添加自定义语言(据我所知),因此您必须替换其中一个预定义语言。我建议您安装一些您不理解的语言,并将其用于合并的语言。可以在Chrome用户个人资料文件夹中找到bdict个文件。