使用Rattle创建的决策树具有很高的根节点错误

时间:2019-07-29 01:40:21

标签: r rattle

我正在创建n = 3410的决策树。目标值包含6个唯一值。这些n = 3410中的每一个都具有这6个值之一。用于创建模型的数据集中的值的分布为:

1-242 2-917 3-645 4-488 5-261 6-841

但是,从该数据创建模型时,值1和5的错误率均为100%。根节点错误率也非常高-73%

我正试图了解什么会导致此问题。我看到这两个值在集合中的相对出现率较低,但在统计上并不显着。我根本无法解释根节点错误。

我已经尝试过调整树并处理数据集本身,但是我仍然始终在矩阵中获得约60%的总体误差。我不是很了解这意味着什么或如何改进-或仅仅是我正在使用的数据。

0 个答案:

没有答案