我在哪里可以下载ispell * .dict和* .affix文件?

时间:2013-08-14 11:17:02

标签: dictionary full-text-search nlp ispell

我对postgresql全文搜索很新,我正在设置配置,我可以在哪里下载ispell * .dict和* .affix文件(正好在docs中):

CREATE TEXT SEARCH DICTIONARY english_ispell (
    TEMPLATE = ispell,
    DictFile = english, 
    AffFile = english, 
    StopWords = english
);

所以,我认为这需要文件english.dictenglish.affix,例如:

/usr/share/postgresql/9.2/tsearch_data

但这些文件不存在。我只有ispell_sample.dictispell_sample.affix - 上面包含的工作正常 - 没问题。

所以...我跟着这个post并从the open office people下载了所需的词典,并将.dic重命名为.dict.aff改为{{1 }}。然后我检查了(使用.affixfile -bi dict.affix并且它们是UTF8编码的。)

当我运行上面的文本搜索字典时,我收到错误:

file -bi english.dict

我想知道是否有人有关于如何解决这个问题的线索,或者是否有人曾经遇到过此问题。 由于./.

更新:1:我想这个问题可以改写如下: ERROR: wrong affix file format for flag CONTEXT: line 2778 of configuration file "/usr/share/postgresql/9.2/tsearch_data/english.affix": "COMPOUNDMIN 1 "

1 个答案:

答案 0 :(得分:2)

这里有一个很好的参考:http://fmg-www.cs.ucla.edu/geoff/ispell-dictionaries.html这对于任何语言的词典来说都是一个很好的资源。