如何根据二元分类器中的预测概率进行排序?

时间:2015-10-05 02:06:47

标签: python pandas scikit-learn

我训练了一个二元分类器,可以得到一个好成绩。

reviews['prediction'] = model.predict(reviews.review.astype(str))
model.score(reviews.review.astype(str), reviews.sentiment)
model.predict_proba(reviews.review.astype(str))

当我打印predict_prob

时,我得到了数组中的概率
array([[ 0. ,  1. ],
       [ 0. ,  1. ],
       [ 0.7,  0.3],
       ..., 
       [ 0. ,  1. ],
       [ 0. ,  1. ],
       [ 0. ,  1. ]])

我如何获得最高概率并将其附加到数据框中,就像我在课堂上一样?

1 个答案:

答案 0 :(得分:0)

您可以在数组上调用max(axis=1)以获取每行的最大值,例如:

reviews['proba'] = predict_prob.max(axis=1)