J48决策树没有提供更好的准确性

时间:2014-04-01 23:00:57

标签: weka

我正在使用Weka来分析提供二元结果的数据。我最初使用10倍交叉验证并使用66%的数据集来训练数据。我得到的准确率是77.1%(正确分类的实例)。然后我试着看看当我使用80%的分割而不是66%时会发生什么,但是使用相同的交叉验证。我得到的准确率仅略高于77.25%。更糟糕的是,当我使用20倍交叉验证,然后进行50倍交叉验证时,绝对没有获得改进。我认为使用更高交叉验证的整个想法是提高准确性!当我使用90%分割10倍甚至20倍时,精度降至74%。有人可以告诉我为什么当我使用较大的分割时,我的准确性没有大幅提高,并且当我使用高交叉验证时,并没有提高AT ALL吗?

1 个答案:

答案 0 :(得分:0)

  

然后我试着看看当我使用80%的分割而不是66%时会发生什么,但是使用相同的交叉验证。

我认为你弄错了。分割和交叉验证百分比是误差估计的两种不同选择。因此,您可以根据百分比分割数据,在这种情况下,算法将在列车集部分上学习,并在测试集部分进行评估。

关于性能改进,更大的测试集不能保证性能提升。也许你的66%足以让分类者学到所有能力。

关于交叉验证,在大多数情况下,10倍被认为是最佳的,更多的折叠不太可能提高您的准确性。您应该更多地了解交叉验证。

最后一句话,如果你的准确度不理想,你可能应该测试另一个分类器,或者使用你的分类器参数。