为什么没有SOLR KStemFilterFactory干掉“#34; card"到"卡"?

时间:2016-09-01 16:14:01

标签: solr porter-stemmer

我在SOLR中使用KStem过滤器工厂(KStemFF)。我意识到KStemFF不是100%准确。

例如,它不会出现“" card"到"卡"。

"声卡"和#34;声卡"返回不同的结果。

有没有办法让这个只使用KStemFF工作?我意识到在这种情况下使用像porter-stemmer这样的其他词干器可能有所帮助,但我真的不想在项目中使用多个词干分析器。

1 个答案:

答案 0 :(得分:0)

KStem在词干词中比PorterStem更具侵略性,因此可能会根据其拥有的规则跳过转换某些复数。 在做出选择之前,您可能希望根据性能和结果比较几个词干分析器。没有单一的词干提取器可以提供100%的准确度和期望的结果,它必须是基于您的结果最多的。