java opennlp工具包中的内置Porter Stemmer

时间:2015-01-22 07:31:37

标签: java machine-learning nlp opennlp porter-stemmer

就像内置的Stemmers一样,如python nltk(https://stackoverflow.com/a/10369407/3096792)中的porter Stemmer,我想知道java apache opennlp中是否有内置的Porter Stemmer虽然这个包下有一个接口[opennlp] .tools.stemmer.Stemmer。由于我不知道或者不需要知道截止的算法,我需要在apache opennlp工具包下使用标准包。如果不存在,那么java中的替代方案是什么?

1 个答案:

答案 0 :(得分:1)

您可以使用Apache Lucene Snowball Library here

只需将此jar文件放入构建路径并使用它

即可
PorterStemmer stemmer = new PorterStemmer();
stemmer.setCurrent(input); //set string you need to stem
stemmer.stem();  //stem the word
stemmer.getCurrent();//get the stemmed word