标签: tree classification
我使用R对数据集应用了分类树,其中包含1070个观测值和18个变量(-1使用响应)。我的训练集是800(随机-种子1),测试集是270。 结果令我有些惊讶。 对于未修剪的树和修剪的树,我得到的训练错误率的结果相同。 测试错误率相同。 训练错误率也不如测试错误率。
使用交叉验证时,无论大小如何,修剪后的树都具有相同的错误率。
我的结果正常吗?因为我期望例如未修剪的树优于修剪的树的测试错误。不相等。
谢谢。