标签: machine-learning classification weka naivebayes bayesian-networks
我在Weka上使用Naive Bayes分类器,在7000个实例的数据集上有15个属性。使用ZeroR,我的基线准确度为87.5%。作为数据预处理的一部分,我使用零均值和单位方差对数据集进行归一化,应用过滤器使数据集随机化。我使用了训练(70%)和测试(30%)集,以及整个数据集的10倍交叉验证,使用了监督离散化和属性选择,我得到的分类器的最佳准确率为93.43%。这是基线准确度的这一小改进吗?