模型失败了个人预测,但得到了总权利

时间:2016-08-11 19:08:31

标签: r classification probability random-forest prediction

所以这就是情况。

我有一个二元分类问题(比方说,观察是否会遇到动作x)。我在一个训练集上训练一个随机森林模型,其中约50%已经完成了动作x而50%没有。我在测试集上测试模型(同样,大约50%做了动作x,50%做了没有),它大约85%左右准确,整体错误率约为15%左右。一年过去了,我得到了新数据,我想看看模型是如何表现的。它预测大约9%的数据将经历行动x。事实上,9%的数据确实经历了行动x,但未能准确预测将经历行动x的个别观察。换句话说,它预测的个体观察将经历动作x实际上没有经历动作x。事实上经历过行动x的个人观察,模型并没有预测到这一点。

基本上,这意味着模型能够使聚合更正,但却未能在微观层面上做出准确的预测,这意味着什么呢?有关于如何发生这种情况的数学解释吗?也许与聚合概率有关?它在预测总数方面是否仍然有用?

0 个答案:

没有答案