鉴于我可能有一个以下列形式编写的ARFF文件:
@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam
我要用它来训练Weka上的朴素贝叶斯分类器。我如何创建一个测试集,以便这个训练有素的分类器能够进行预测?感谢。
答案 0 :(得分:1)
有许多数据存储库,您可以在其中找到垃圾邮件和非垃圾邮件示例(来自现实生活中)。然后,获取垃圾邮件/非垃圾邮件的正文并制作类似这样的arff文件(但这次它将测试arff文件)带有适当的标签(垃圾邮件正文的垃圾邮件和非垃圾邮件正文的垃圾邮件) )。使用训练arff文件,您将获得分类器模型。保存该模型。然后在Weka explorer分类选项卡上,选择单选按钮“test set”并选择您的测试集(尽管它会有标签)。然后加载您的训练模型,右键单击它,然后选择使用测试集重新评估。你完成了。