我正在使用Python进行分类任务,将不同乐器的音频文件分类到各自的类中,在我的例子中有4个类,分别是Brass,String,Percussion和Woodwind。我使用了3种不同的算法,k-Nearest Neighbor,Naive Bayes和SVM。我的代码看起来有点像这样:
#X is feature matrix, y is class vector
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
#k-NN Classifier
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train,y_train)
knn_pred = knn.predict(X_test)
print(metrics.classification_report(y_test,knn_pred)
#Naive Bayes Classifier
nb = GaussianNB()
nb.fit(X_train,y_train)
nb_pred = nb.predict(X_test)
print(metrics.classification_report(y_test,nb_pred)
#SVM Classifier
svm = SVC()
svm.fit(X_train,y_train)
svm_pred = knn.predict(X_test)
print(metrics.classification_report(y_test,svm_pred)
当我尝试运行此代码时,我的SVM分类器出现问题。错误代码如下所示:
precision recall f1-score support
Brass 1.00 0.21 0.34 72
Percussion 0.38 1.00 0.55 279
String 1.00 0.15 0.26 276
Woodwind 0.00 0.00 0.00 156
avg / total 0.58 0.43 0.32 783
C:\Users\Anaconda3\lib\site-packages\sklearn\metrics\classification.py:1135: UndefinedMetricWarning: Precision and F-score are ill-defined and being set to 0.0 in labels with no predicted samples.
当我从SVM分类器(svm_pred)检查我的预测标签时,没有Woodwind类预测导致Precision的值和Woodwind类的F1-Score为0.0。这个问题只发生在SVM分类器上,尽管我对所有3种算法使用了相同的训练集。任何人都知道如何解决这个问题?
注意:我所有4个类的数据集都是不平衡的,我怀疑可能会触发此错误
答案 0 :(得分:0)
我认为我知道你的问题是什么。可能是因为SVM分类器没有正确地为Woodwind类分类任何实例。然后,当他试图计算Woodwind类的精度时,他得到0,因为为了计算精度,他做了类似的事情:
真阳性除以(真阳性+假阳性)。
但是真阳性的值等于0,那么他无法计算0除以某事。这就是精确分数值为0的原因。召回和F1也是如此。
请记住,true positives是Woodwind类被分类器正确分类的实例数。