我已经阅读了这个问题:How should we interpret the results of the H2O predict function? 仍然不明白p1是否是[0,1]之间的概率,并且可以平等使用,因为它是一个回归,我可以应用我自己的阈值
编辑: 谢谢你的答案仍然有一些混乱,让我们挖掘它假设我的结果Y是[0,1],如果Y是数字我运行它作为REGRESSION我有一个列作为响应。另一方面,如果Y是因子,则将其作为CLASSIFICATION运行,输出为:prediction / p0 / p1。现在,p1与使用Y作为数字相同吗? 此外http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/calibrate_model.html calibrate_model参数会影响logloss,但现在最大F1仍用作P0 P1或校准概率的阈值?我可以使用校准的概率进行回归,因为对数减少了吗?
答案 0 :(得分:1)
H2O的二元分类问题的输出将为您提供类别标签(其中阈值设置为获得最大F1分数),0级预测值(p0)和1级预测值(P1)。
如果您需要将H2O的模型参数calibrate_model
设置为True,则需要实际概率,这些预测值是未校准的概率。
所以要回答你的问题,是p1
是介于0和1之间的预测值(例如,您会看到类似.23,.45。,。89等的值。 )并且因为H2O构建回归树,你可以在技术上使用1-p0
来获得p1
值(反之亦然),事实上除非你设置binomial_double_trees = True
这正是H2O正在做的事情:它为其中一个类构建一个回归树,然后取1-(该类值)来获取另一个类的预测值。