为什么决策树显示正确的分类,而某些实例被错误分类

时间:2014-10-21 16:59:24

标签: classification weka decision-tree prediction

我正在使用WEKA,10倍交叉验证或拆分66%来创建培训和测试集..我使用c4.5(J48)作为分类器.. 我在结果中得知一些实例被错误分类,但是,当我想象树时,我看到基于树的实例应该被正确分类!!!

当测试集是相同的训练集时,我没有看到这个...如果分类器决定创建这样一个树,为什么有些实例没有基于这个树进行分类???

提前致谢。

1 个答案:

答案 0 :(得分:0)

这听起来像是在完全未经修剪的树之后,训练数据应该返回100%的准确度。

可能导致不良后果的选项概述如下:

  • Unpruned 用于最小化决策树中的规则数量,并可导致较低的泛化错误
  • minNumObj 用于确定制定规则所需的最小案例数。如果这大于1,则可能会在训练数据上出现一些错误。

我通常不会建议在给定问题上使用这些选项,但如果您尝试获得训练数据的100%结果,那么这将是开始的地方。

希望这有帮助!