在SOLR 3.5文本字段类型中,StopFilterFactory列在PorterStemFilterFactory之前。
这是否意味着如果我想停止例如“游戏”和“游戏”,我将不得不将两者都添加到停用词中?
如果是这样会在PorterStemFilterFactory之后移动StopFilterFactory,并且只是将“游戏”添加到停用词会导致“游戏”和“游戏”的出现被剥夺?
我想真正的问题是这样做的最佳方式是什么,我是否需要将这个词的所有变体添加到停用词?
答案 0 :(得分:2)
PorterStemFilterFactory
提供积极的词干,并且在停止词过滤器之前可能不会导致正确的停止词删除,因为根可能与您尝试停止的词不同。
您只能在停用词过滤器之前使用solr.EnglishMinimalStemFilterFactory
添加复数处理
这将处理复数,然后停止词只需要处理单数形式
然后,您可以添加PorterStemFilterFactory过滤器来处理正确的词干。