我如何防止weka中的雪球干扰器堵塞"糟糕"到了" aw"?

时间:2017-05-05 02:21:50

标签: machine-learning weka text-mining text-classification

我正在使用Weka对2000 IMBD电影评论进行分类。我关注的是:http://www.stefanoscerra.it/movie-reviews-classification-weka-data-mining/

每当我做干事时,这个词就会变得很糟糕"干到" aw"。我甚至尝试过包含的LovinsStemmer并得到了相同的结果。在页面中提到的tutroial,仍在做阻止部分,但他有可怕的"属性列表中的单词。

StringtoWordVector

attributes

另外,我是Weka的新手,所以可能是我对雪球塞的实现不正确。 我刚下载了这个jar文件:http://weka.wikispaces.com/file/view/snowball-20051019.jar/82917267/snowball-20051019.jar

我设置了这样的类路径:java -classpath“weka.jar:snowball-20051019.jar”weka.gui.GUIChooser

0 个答案:

没有答案