sklearn使用prob_a进行逻辑二进制分类

时间:2015-12-13 00:48:35

标签: python scikit-learn classification

有没有办法报告sklearn模型二进制分类模型的预期值?在previous question有人推荐def do_something(x, y): x.insert(0, ’z’) y = [’z’] + y 。我期待一个类似于xgboost包predict_proba参数的输出。但是,似乎这不会产生预期的结果。我的Y列车价值是谨慎的。

我对"objective": "binary:logistic"的输出感到困惑。因为我只有一个目标,所以我期待返回一个列预测。但是,这会返回两列,这些列总和为一列。这些值似乎与模型实际预测的值不对应:

predict_proba

1 个答案:

答案 0 :(得分:7)

predict_proba的输出数组中的列是分类器预测的不同标签的概率。在您的情况下,您已经构建了二元分类器,因此第一列modl.predict_proba(X_test)[:,0]是标签为0的概率,第二列modl.predict_proba(X_test)[:,1]是标签的概率是1