全部,
以下是R:
中种植的随机森林的简单示例Y <- iris[, 5]
X <- iris[, 1:4]
fit <- randomForest(X, Y)
pred0 <- predict(fit)
pred1 <- predict(fit, newdata = X)
which(pred0 != pred1)
为什么森林中存储的预测值与训练数据中的预测值之间存在任何差异。我正在使用更复杂的数据集,并且看到了大量的差异。我和cutoff
一起玩过,这似乎不是造成差异的原因。
干杯, 亚伦
更新:
看起来pred1
的调用只是返回目标训练值。
mean(pred0 == Y)
# 0.9533333
mean(pred1 == Y)
# 1
我对此感到困惑:它不应该仅返回存储在fit$predicted
中的相同向量吗?