我知道SVM(特别是线性SVC)有一个选项,即当probability = True
作为可选参数实例化时,model.predict_proba()
应该给出每个预测的概率以及标签(1或0)。但是,当我调用"use all() on an 1 dimensional array"
时,我一直收到numpy错误predict_proba()
,我只能弄清楚如何使用model.predict()
以标签(1或0)的形式进行预测。
答案 0 :(得分:2)
文档示例适用于我设置标记probability=True
。问题必须出在输入数据中。试试这个非常简单的例子:
import numpy as np
X = np.array([[-1, -1], [-2, -1], [1, 1], [2, 1]])
y = np.array([1, 1, 2, 2])
from sklearn.svm import SVC
clf = SVC(probability=True)
clf.fit(X, y)
print(clf.predict([[-0.8, -1]]))
print(clf.predict_proba([[-0.8, -1]]))
答案 1 :(得分:0)
您可以使用CallibratedClassifierCV。
from sklearn.calibration import CalibratedClassifierCV
model_svc = LinearSVC()
model = CalibratedClassifierCV(model_svc)
model.fit(X_train, y_train)
pred_class = model.predict(y_test)
probability = model.predict_proba(predict_vec)
您将获得数组值中的预测概率分数。