每次在sklearn中出现错误消息

时间:2019-01-12 16:38:53

标签: python svm data-science

我正在使用sklearn在python上编写支持向量机。但是,每次我运行该程序时都会发生错误。我尝试了很多方法,但没有用。

问题是我的来源(功能)已经给出,但不是我自己设置的。

错误是“指定的至少一个标签必须在y_true中” 我不知道这是什么意思。 我尝试了Internet上的所有方法。它们都很复杂,我不知道如何在程序中实现。

from sklearn.metrics import classification_report, confusion_matrix
import itertools
yhat = clf.predict(X_test)
def plot_confusion_matrix(cm, classes,
                      normalize=False,
                      title='Confusion matrix',
                      cmap=plt.cm.Blues):

    if normalize:
        cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
        print("Normalized confusion matrix")
    else:
        print('Confusion matrix, without normalization')

    print(cm)

    plt.imshow(cm, interpolation='nearest', cmap=cmap)
    plt.title(title)
    plt.colorbar()
    tick_marks = np.arange(len(classes))
    plt.xticks(tick_marks, classes, rotation=45)
    plt.yticks(tick_marks, classes)

    fmt = '.2f' if normalize else 'd'
    thresh = cm.max() / 2.
    for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
        plt.text(j, i, format(cm[i, j], fmt),
                 horizontalalignment="center",
                 color="white" if cm[i, j] > thresh else "black")

    plt.tight_layout()
    plt.ylabel('True label')
    plt.xlabel('Predicted label')

cnf_matrix = confusion_matrix(y_test, yhat, labels=[2,4])

np.set_printoptions(precision=2)

print (classification_report(y_test, yhat))

plt.figure()
plot_confusion_matrix(cnf_matrix, classes= 
['Benign(2)','Malignant(4)'],normalize= False,  title='Confusion matrix')

我希望显示整个图片,但不会发生错误。请帮忙。

错误消息:

 ValueError                                Traceback (most recent call last)
 <ipython-input-28-2fde8d1a966e> in <module>()
----> 1 cnf_matrix = confusion_matrix(y_test, yhat, labels=[2,4])
      2 
      3 np.set_printoptions(precision=2)
      4 
      5 print (classification_report(y_test, yhat))

 /opt/conda/envs/DSX-Python35/lib/python3.5/site-packages/sklearn/metrics/classification.py in confusion_matrix(y_true, y_pred, labels, sample_weight)
     257         labels = np.asarray(labels)
     258         if np.all([l not in y_true for l in labels]):
 --> 259             raise ValueError("At least one label specified must be in y_true")
     260 
     261     if sample_weight is None:

 ValueError: At least one label specified must be in y_true

0 个答案:

没有答案