如何确定哪个标签在H2O二进制分类器中被视为“正”类?

时间:2018-11-19 22:05:19

标签: h2o

使用h2o.ai训练二进制分类器,并想知道哪个标签被认为是“正”类。之所以会有所不同,是因为如果有标签说“给cookie”和“不给cookie”,并且正在尝试优化以最大化召回,具体取决于哪个标签是我们的“积极”类将发出更多(“给cookie”是肯定的类)或更少(“不给cookie”是肯定的类)的cookie。

SO上的另一篇文章(How do I specify the positive class in an H2O random forest or other binary classifier?)似乎暗示默认情况下,级别值是按alpha顺序分配的(“ a”是最低级别,“ z”是最高级别),并尝试在此处确认为这是自己的明确问题。

还有一种方法可以查看哪个类别当前是模型的“正”类别(即,基于使用some_h20_model.confusion_matrix(...)输出命令时混淆矩阵标签的顺序)?

1 个答案:

答案 0 :(得分:0)

您要验证的是正确的,H2O-3的顺序按字典顺序排列。

您可以使用此混淆矩阵作为混淆矩阵排序方式的示例(即,如果您具有分类并且以字母顺序对其进行排序,它们将映射到0,1,2 ...,如图所示)

enter image description here

这是一个使用No和Yes的二进制结果的示例,其中No映射为0,Yes映射为1。

enter image description here