标签: r
有人知道cv.tree在R中的工作原理吗?它是否会一次生长一个大型决策树,执行一次成本复杂性修剪(也一次),然后通过交叉验证选择最佳子树?还是做得正确,依次为每个折页建立一个大型决策树(基于其他折页作为训练集),对每个大树重复执行成本复杂度修剪,使用剩余折页上的性能选择最佳复杂度参数,平均结果,然后选择基于完整训练集的新大型决策树的对应子树? James等人的算法8.1。 “统计学习入门”描述了后者的过程,但是我怀疑在cv.tree中实现的是前者。谢谢。