Question

假设我有一个数据样本，具有两个标记为0和1的类。当我运行output = clf.predict_proba(X_input)时，output中的每一行都由2列组成，分别对应于每个类别的概率。

“输入样本的类概率。类的顺序与属性classes_中的顺序相对应。”

这是否意味着数据样本的第一个元素为0或1 对应于predict_proba输出的第一列？

Answer 1

通常，分类器将具有名为classes_的属性，该属性将在装配和存储类时填充。 predict_proba方法输出的顺序与此属性中的顺序相同。

例如：

nb = MultinomialNM()
nb.fit(some_gender_data)
nb.classes_
array(['F', 'M'], dtype='<U1')

据我所知，sklearn中的所有分类器均具有该属性。