Sklearn SVM - UndefinedMetricWarning

时间:2018-03-03 21:42:14

标签: python python-3.x scikit-learn svm

我正在使用Python进行分类任务,将不同乐器的音频文件分类到各自的类中,在我的例子中有4个类,分别是Brass,String,Percussion和Woodwind。我使用了3种不同的算法,k-Nearest Neighbor,Naive Bayes和SVM。我的代码看起来有点像这样:

#X is feature matrix, y is class vector
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

#k-NN Classifier
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train,y_train)
knn_pred = knn.predict(X_test)
print(metrics.classification_report(y_test,knn_pred)

#Naive Bayes Classifier
nb = GaussianNB()
nb.fit(X_train,y_train)
nb_pred = nb.predict(X_test)
print(metrics.classification_report(y_test,nb_pred)

#SVM Classifier
svm = SVC()
svm.fit(X_train,y_train)
svm_pred = knn.predict(X_test)
print(metrics.classification_report(y_test,svm_pred)

当我尝试运行此代码时,我的SVM分类器出现问题。错误代码如下所示:

      precision    recall  f1-score   support

  Brass       1.00      0.21      0.34        72
Percussion    0.38      1.00      0.55       279
 String       1.00      0.15      0.26       276
 Woodwind     0.00      0.00      0.00       156

 avg / total  0.58      0.43      0.32       783

C:\Users\Anaconda3\lib\site-packages\sklearn\metrics\classification.py:1135: UndefinedMetricWarning: Precision and F-score are ill-defined and being set to 0.0 in labels with no predicted samples.

当我从SVM分类器(svm_pred)检查我的预测标签时,没有Woodwind类预测导致Precision的值和Woodwind类的F1-Score为0.0。这个问题只发生在SVM分类器上,尽管我对所有3种算法使用了相同的训练集。任何人都知道如何解决这个问题?

  

注意:我所有4个类的数据集都是不平衡的,我怀疑可能会触发此错误

1 个答案:

答案 0 :(得分:0)

我认为我知道你的问题是什么。可能是因为SVM分类器没有正确地为Woodwind类分类任何实例。然后,当他试图计算Woodwind类的精度时,他得到0,因为为了计算精度,他做了类似的事情:

真阳性除以(真阳性+假阳性)。

但是真阳性的值等于0,那么他无法计算0除以某事。这就是精确分数值为0的原因。召回和F1也是如此。

请记住,true positives是Woodwind类被分类器正确分类的实例数。