混淆矩阵“无法处理多类和未知的混合”

时间:2015-02-04 12:14:00

标签: python numpy scikit-learn multilabel-classification

我的混淆矩阵出现了一个我无法理解的错误。 我想要一个混淆矩阵来显示两个数组y_predy_test之间的混淆。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix, roc_curve, auc
from sklearn.metrics import accuracy_score
import pylab as pl

# Code that fills up two numpy arrays, y_test and y_pred with integers

print y_test.shape
print y_pred.shape

cm = confusion_matrix(y_test,y_pred)
plt.matshow(cm)
plt.title('Confusion matrix')
plt.colorbar()
plt.ylabel('True label')
plt.xlabel('Predicted label')
plt.show()

错误是:

Traceback (most recent call last):
  File "C:\work_asaaki\code\test_samme_46_classes_unconfused.py", line 159, in <module>
    cm = confusion_matrix(y_test,y_pred)
  File "C:\Anaconda\lib\site-packages\sklearn\metrics\metrics.py", line 742, in confusion_matrix
    y_type, y_true, y_pred = _check_clf_targets(y_true, y_pred)
  File "C:\Anaconda\lib\site-packages\sklearn\metrics\metrics.py", line 115, in _check_clf_targets
    "".format(type_true, type_pred))
ValueError: Can't handle mix of multiclass and unknown

错误是什么意思? 当我打印出y_pred.shapey_test.shape时,我会得到相同的形状,(318L)。两个数组的值介于0到29之间。

1 个答案:

答案 0 :(得分:3)

没关系,我找到了答案,这很简单。 问题是在代码(未显示)中,我使用dtype=object将y_pred填充为numpy数组,喜欢这个:

y_pred = np.array(pickle.load(file("PATH_TO_FILE")), dtype=object)

我删除了dtype=object部分,但效果很好。