所以这就是情况。
我有一个二元分类问题(比方说,观察是否会遇到动作x)。我在一个训练集上训练一个随机森林模型,其中约50%已经完成了动作x而50%没有。我在测试集上测试模型(同样,大约50%做了动作x,50%做了没有),它大约85%左右准确,整体错误率约为15%左右。一年过去了,我得到了新数据,我想看看模型是如何表现的。它预测大约9%的数据将经历行动x。事实上,9%的数据确实经历了行动x,但未能准确预测将经历行动x的个别观察。换句话说,它预测的个体观察将经历动作x实际上没有经历动作x。事实上经历过行动x的个人观察,模型并没有预测到这一点。
基本上,这意味着模型能够使聚合更正,但却未能在微观层面上做出准确的预测,这意味着什么呢?有关于如何发生这种情况的数学解释吗?也许与聚合概率有关?它在预测总数方面是否仍然有用?