就像内置的Stemmers一样,如python nltk(https://stackoverflow.com/a/10369407/3096792)中的porter Stemmer,我想知道java apache opennlp中是否有内置的Porter Stemmer虽然这个包下有一个接口[opennlp] .tools.stemmer.Stemmer。由于我不知道或者不需要知道截止的算法,我需要在apache opennlp工具包下使用标准包。如果不存在,那么java中的替代方案是什么?
答案 0 :(得分:1)
您可以使用Apache Lucene Snowball Library here
只需将此jar文件放入构建路径并使用它
即可PorterStemmer stemmer = new PorterStemmer();
stemmer.setCurrent(input); //set string you need to stem
stemmer.stem(); //stem the word
stemmer.getCurrent();//get the stemmed word