scikit-learn中的predict_proba的输出

时间:2018-06-28 17:44:08

标签: python machine-learning scikit-learn

假设我有一个数据样本,具有两个标记为0和1的类。当我运行output = clf.predict_proba(X_input)时,output中的每一行都由2列组成,分别对应于每个类别的概率。

第一列代表类别0或1的概率吗? The predict_proba method of GradientBoostingClassier说:

  

“输入样本的类概率。类的顺序与属性classes_中的顺序相对应。”

这是否意味着数据样本的第一个元素为0或1 对应于predict_proba输出的第一列?

1 个答案:

答案 0 :(得分:3)

通常,分类器将具有名为classes_的属性,该属性将在装配和存储类时填充。 predict_proba方法输出的顺序与此属性中的顺序相同。

例如:

nb = MultinomialNM()
nb.fit(some_gender_data)
nb.classes_
array(['F', 'M'], dtype='<U1')

据我所知,sklearn中的所有分类器均具有该属性。