我已经使用rpart软件包在R中创建了分类和回归树(CART)模型。我的因变量是一个连续变量,所以我制作了一个回归树。我也做了修剪。我有两个主要问题:
- 基于此链接[rpart: Is training data required]
[1]我知道我应该将数据分为训练和测试集。我已经做到了,但是我不知道如何修剪以非叶节点N为根的子树并将其替换为多数类。
- 我正在寻找对这种模型(CART)进行所需测试的资源。换句话说,我应该使用哪种拟合优度度量以及如何(用R编码)度量CART模型的准确性。
谢谢。如果您对上述每个问题都知道,请在回复中提供链接,谢谢!