我是机器学习的新手,使用随机森林算法对不平衡数据集进行预测。我在R中构建了模型,响应变量是二进制分类(0,1)。在R中构建的随机森林模型产生了适当的分类,但是当该模型被转换为h2o pojo以构建应用程序时,该模型仅返回" 1"作为回应。
答案 0 :(得分:1)
[更新:答案是在编辑OP之前编写的,以澄清问题仅在转换为POJO后出现 - 见评论]
我敢打赌你的数据集高度不平衡,即你的训练集中的1比0更多。
即使你在模型拟合期间获得了很好的准确性,在这种情况下,作为度量的准确性毫无意义,你应该使用精确,召回和混淆矩阵 - 谷歌“类不平衡”更多。
例如,如果85%的训练标签是1,那么通过将所有样本分类为1,可以简单地(并且天真地)获得85%准确度的“分类器”(可以说,并不是你想要做的事情。)