我想在这里使用词干分析器来合并字数
http://snowball.tartarus.org/download.html
该页面有一个下载链接,但我不知道如何将文件集成到我的eclipse项目中
它不仅仅是一个放入我的lib文件夹的jar,它是一个文件系统。
有没有人知道解释这个的一些文件,因为我在网站上没有看到任何文件
(如,我要导入什么,如何调用它等等。)
答案 0 :(得分:15)
构建jar文件并将其添加到Build Path。
详细说明:
然后你可以使用词干分析器做类似的事情:
import org.tartarus.snowball.ext.spanishStemmer;
...
spanishStemmer stemmer = new spanishStemmer();
stemmer.setCurrent("torero");
if (stemmer.stem()){
System.out.println(stemmer.getCurrent());
}