使用DBsight lucene的屈曲形式的动词?

时间:2009-10-28 14:08:23

标签: lucene lucene.net synonym lemmatization

我知道dbsight允许同义词和停用词进行搜索,但这样做也会处理动词的屈折形式,例如对于'游泳'它应该找到游泳,游泳,游泳,游泳和游泳

DBSight Wiki上的链接:http://wiki.dbsight.com/index.php?title=User_dictionary

2 个答案:

答案 0 :(得分:1)

您正在寻找的行为可以使用lemmatization来实施。我不知道现有的Lucene分析仪可以做到这一点。 Basis Tech's Lucene package确实是词形还原,但不是免费的,我不知道它是否适用于dbsight。

答案 1 :(得分:0)

Lucene带有一个名为“Lucene SnowBall stemmer”(http://lucene.apache.org/java/2_4_0/api/contrib-snowball/index.html)的词干分析器。结果证明DBsight将其作为名为SnowBall的分析器公开 - [语言] 例如SnowBall - English,SnowBall - 法语等。