Open Spell-Checkers的字典文件结构

时间:2011-10-24 20:59:30

标签: dictionary spell-checking openoffice.org libreoffice hunspell

FreeDict,Aspell,Hunspell / OpenOffice Dictionaries的文件结构是否有任何解释文档或教程,特别是关于每个.dic文件中每行末尾的开关?我的猜测是,开关描述了单词的语义解释,无论它是否为

  • 名词
  • 形容词
  • 副词
  • 副词

或以上的任何组合。但我不知道如何将这些与开关字符相匹配。

我也很关心.aff文件描述的内容。

3 个答案:

答案 0 :(得分:1)

This看起来是个不错的起点,downloads at this page可能包含您正在寻找的格式文档。

答案 1 :(得分:1)

只有几个可能对您有所帮助的链接:

这是在stackoverflow上: What's the format of the OpenOffice dictionaries?

这第二个是一个好的开始

http://sourceforge.net/apps/mediawiki/freedict/index.php?title=Main_Page

希望这会有所帮助

答案 2 :(得分:0)

在Hunspell中,您选择的标签是任意的,除了您指定的标签外,它们没有任何意义。您可以选择使用字母,数字(1-65535)等。

词缀文件描述了许多内容,但主要关注的是单词是如何变形的。

例如:

$ test.dic
4
apple/a
banana/a
green/b
small/b

$ test.aff
SFX a Y 2 # Allow the following 2 suffixes to words with the "a" flag.
SFX a 0 s . # An "s" at the end for words ending in any letter (signified by the dot). "Apples" and "bananas". 
SFX a 0 s' . # "Apples'" and "bananas'".

SFX b Y 2
SFX b 0 er . # "Greener" and "smaller".
SFX b 0 est . # "Greenest" and "smallest".

The manual详细解释了大部分内容。还有一些可以查看的测试文件。