我是weka的新手,我要从社交网络中提取状态并使用weka分析它们,如何构建包含这些状态的arff文件? Weka是否包含词干,停用词和n-gramm的算法,或者我是否要使用其他软件以便在开始分类之前消除不必要的数据?而对于android和java的weka的实用程序,这个软件的使用是否存在差异......你有什么想法吗
答案 0 :(得分:0)
答案 1 :(得分:0)
您不必担心将数据作为arff
文件,因为Weka支持其他输入格式。您只需将数据作为csv
文件并导入Weka即可。如果需要,您可以将其从Weka导出为arff
。
有一个Weka to android的端口,你可以download here,我确实在我的项目中使用它没有问题。您可以在PC中训练您的模型并将其导出,然后在android see my answer here中使用它作为示例代码。
是的,Weka支持Stemmer algorithms