默认预测与使用randomForest的训练数据的预测不同

时间:2014-05-12 20:22:20

标签: r random-forest

全部,

以下是R:

中种植的随机森林的简单示例
Y <- iris[, 5]
X <- iris[, 1:4]
fit <- randomForest(X, Y)
pred0 <- predict(fit) 
pred1 <- predict(fit, newdata = X) 
which(pred0 != pred1)

为什么森林中存储的预测值与训练数据中的预测值之间存在任何差异。我正在使用更复杂的数据集,并且看到了大量的差异。我和cutoff一起玩过,这似乎不是造成差异的原因。

干杯, 亚伦

更新:

看起来pred1的调用只是返回目标训练值。

mean(pred0 == Y) 
# 0.9533333
mean(pred1 == Y)
# 1

我对此感到困惑:它不应该仅返回存储在fit$predicted中的相同向量吗?

0 个答案:

没有答案