我正在一个包含许多零的数据集上运行一个随机森林。与可以归类为“缺失”的数据相比,这些零代表某种事物(或不存在某种事物)的计数,因此是有意义的。
当我运行预测时,我发现我的RF似乎不愿预测零,几乎就像它没有将0看成一个数字,因此默认为1。有办法解决吗?我只是觉得奇怪的是,任何时候都没有出现零。
答案 0 :(得分:0)
这对我来说并不奇怪,但这确实取决于您的数据集。 基本上,随机森林输出是训练值的平均值(如果您不知道它是如何计算的,我邀请您寻找一些理论来帮助您了解随机森林的计算方式...)。因此,除非您的目标几乎完全是由零或非常明确定义的模式组成(例如,某个功能具有某些特定值,则目标始终为始终 0),这代表了很多训练案例,输出精确为0的几率非常低。
话虽如此,如果期望您的输出是整数(例如0),则可以将其舍入。