如何为weka构建一个arff文件?

时间:2013-02-14 07:53:29

标签: android classification weka document-classification

我是weka的新手,我要从社交网络中提取状态并使用weka分析它们,如何构建包含这些状态的arff文件? Weka是否包含词干,停用词和n-gramm的算法,或者我是否要使用其他软件以便在开始分类之前消除不必要的数据?而对于android和java的weka的实用程序,这个软件的使用是否存在差异......你有什么想法吗

2 个答案:

答案 0 :(得分:0)

我不知道脸书,但是你可以通过使用arff文件来获取推特数据here至于如何创建它们,在线有数百个教程:看看this one并查看如果它对你有所帮助。

希望这有帮助

拉​​结

答案 1 :(得分:0)

您不必担心将数据作为arff文件,因为Weka支持其他输入格式。您只需将数据作为csv文件并导入Weka即可。如果需要,您可以将其从Weka导出为arff

有一个Weka to android的端口,你可以download here,我确实在我的项目中使用它没有问题。您可以在PC中训练您的模型并将其导出,然后在android see my answer here中使用它作为示例代码。

是的,Weka支持Stemmer algorithms