我正在使用OneVsRestClassifer包装器的多标签逻辑回归分类器,但是我遇到了一个问题,对于某些观察,它不返回任何标签,并且predict_proba函数返回非常接近零的所有概率,即使我知道这些例子属于至少一个类。
有没有办法校准这样的多标签分类器,以便它不会返回任何标签?
更新#1 我正在使用的代码适合分类器并检索概率:
#Fit the classifier
clf = LogisticRegression(C=1., solver='lbfgs')
clf = OneVsRestClassifier(clf)
mlb = MultiLabelBinarizer()
mlb = mlb.fit(train_labels)
train_labels = mlb.transform(train_labels)
clf.fit(train_profiles, train_labels)
#Predict probabilities:
probas = clf.predict_proba([x_test])
为了给出一些背景知识,分类器被训练并在数据矢量轮廓上测试文本语料库。在应用维数减少算法(SVD)之后检索这些简档。我想知道是否可能需要任何额外的规范化,但也期望多标签分类器总是返回一些标签而不需要对配置文件进行任何额外的预处理。