标签: r random-forest
有人可以解释R包中随机林区的sampsize和classwt之间的区别。两个参数之间是否存在任何关系(假设问题是分类问题)
由于
答案 0 :(得分:0)
sampsize表示绘制的样本大小。因此,sampsize = 10意味着绘制了10个样本。 classwt是类的权重。这可以用于加权随机森林。例如,您可以使用它来加权更新的数据而不是旧数据(请参阅here)。话虽如此,下采样(减少样本量)似乎与加权类一样有效(见here),所以你可以,但不必同时使用它们。
sampsize
sampsize = 10
classwt