SOLR词干和停用词

时间:2013-06-12 10:11:51

标签: solr stemming stop-words

在SOLR 3.5文本字段类型中,StopFilterFactory列在PorterStemFilterFactory之前。

这是否意味着如果我想停止例如“游戏”和“游戏”,我将不得不将两者都添加到停用词中?

如果是这样会在PorterStemFilterFactory之后移动StopFilterFactory,并且只是将“游戏”添加到停用词会导致“游戏”和“游戏”的出现被剥夺?

我想真正的问题是这样做的最佳方式是什么,我是否需要将这个词的所有变体添加到停用词?

1 个答案:

答案 0 :(得分:2)

PorterStemFilterFactory提供积极的词干,并且在停止词过滤器之前可能不会导致正确的停止词删除,因为根可能与您尝试停止的词不同。
您只能在停用词过滤器之前使用solr.EnglishMinimalStemFilterFactory添加复数处理 这将处理复数,然后停止词只需要处理单数形式 然后,您可以添加PorterStemFilterFactory过滤器来处理正确的词干。