我知道dbsight允许同义词和停用词进行搜索,但这样做也会处理动词的屈折形式,例如对于'游泳'它应该找到游泳,游泳,游泳,游泳和游泳
DBSight Wiki上的链接:http://wiki.dbsight.com/index.php?title=User_dictionary
答案 0 :(得分:1)
您正在寻找的行为可以使用lemmatization来实施。我不知道现有的Lucene分析仪可以做到这一点。 Basis Tech's Lucene package确实是词形还原,但不是免费的,我不知道它是否适用于dbsight。
答案 1 :(得分:0)
Lucene带有一个名为“Lucene SnowBall stemmer”(http://lucene.apache.org/java/2_4_0/api/contrib-snowball/index.html)的词干分析器。结果证明DBsight将其作为名为SnowBall的分析器公开 - [语言] 例如SnowBall - English,SnowBall - 法语等。