h2o随机森林计算多项式分类的MSE

时间:2015-10-25 15:57:18

标签: classification random-forest multinomial h2o

为什么h2o.randomforest计算出包含样本的MSE以及针对多重邮件分类问题进行培训?

我也使用h2o.randomforest进行了二元分类,在AUCout of bag sample使用它来计算training但是对于多分类,随机森林正在计算看似可疑的MSE。请看这个截图。

enter image description here

我的目标变量是一个包含4个因素级别model1model2model3model4的因子。在屏幕截图中,您还会看到这些因素的混淆矩阵。

有人可以解释一下这种行为吗?

1 个答案:

答案 0 :(得分:1)

二项和多项分类都显示MSE,因此您将在两个模型的评分历史表中看到它(突出显示training_MSE列)。

H2O不评估多项AUC。存在一些评估方法,但还没有一种广泛采用的方法。 pROC package讨论了Hand and Till的方法,但提到它无法绘制,结果很少被测试。记录丢失和分类错误仍然可用,特定于分类,因为每个都有多项背景下的标准评估方法。

正如您所强调的那样,有一个混淆矩阵比较您的4个因子水平。你能澄清一下你的期望吗?如果您正在寻找四个单独的混淆矩阵,则四列表包含足够的信息,可以计算它们。