Lucene 4.1.0 Porter Stemmer无法正常工作

时间:2013-06-03 04:49:18

标签: java algorithm lucene porter-stemmer

我在Java中使用我的应用程序,并使用Lucene 4.1.0来使用Porter Stemmer方法。 我已阅读并实施this

这是我的代码

import org.apache.lucene.analysis.snowball.*;
import org.tartarus.snowball.ext.PorterStemmer;


 private String stemmer(String word){
        PorterStemmer obj = new PorterStemmer();
        obj.setCurrent(word);
        obj.stem();
        return obj.getCurrent();
}

这种方法有效,但是Porter Stemmer对于某些单词不能正常工作,例如:

  1. source>>源程序
  2. 耦合>> coupl
  3. 伴随>> accompani
  4. 也许这是算法中的一个错误? 如何解决这个问题?

2 个答案:

答案 0 :(得分:2)

预计Porter Stemmer算法将转换源>>源程序。请从here

了解更多有关porter stemmer算法的信息

答案 1 :(得分:0)

您可以在porter stemmer上使用单词建议器。对于单词建议,您可以使用“在java中建议基本”