波兰语搜索Sphinx?

时间:2011-02-03 19:05:11

标签: search full-text-search sphinx stemming polish

我想为用Django编写的网站实现搜索解决方案。从可用的选项(我研究过Solr,Sphinx,Xapian,PostgreSQL / Tsearch3,MySQL)看,Sphinx看起来是最好的。但是,它不支持波兰语的词干,这是我想要搜索的数据的语言。

在Sphinx中处理不受支持的语言的最佳方法是什么?我有一种直觉,我可以从Ispell字典创建一个词干语料库。我怎样才能与Sphinx合作?

1 个答案:

答案 0 :(得分:0)

http://snowball.tartarus.org/邮件主管中搜索,如果有人试图创建波兰语词干,您可能会发现一些信息。有2个免费的词干分析器,但它们是用java制作的(我认为至少有一个是用于solr / lucene)。从Ispell,我不确定词干语料库是否可以帮助你,你可以创建用于wordforms或excepts的文件。