我正在尝试使用R中的朴素贝叶斯将推文分为8类(0-7)。但是NB分类器不能很好地工作。 因此,我将类别数减少为2(0个垃圾邮件,1个火腿)以了解可能是什么问题。但是分类器仍然无法正常工作。
应用要素后,数据集如下所示
library (caret)
set.seed(32984)
indexes <- createDataPartition(final$Label, times = 1,
p = 0.7, list = FALSE)
train <- final[indexes,]
test <- final[-indexes,]
library(e1071)
classifier <- naiveBayes(train[,-1], train$Label)
prediction <- predict(classifier, test[,-1])
cm <- table(test$Label, prediction)
结果,垃圾邮件/火腿的cm表看起来像这样
像这样的8个类别
我希望数据至少可以归类为火腿/垃圾邮件和8类,但它不起作用。我将SVM应用于相同的数据集,并且效果更好-它对垃圾邮件/火腿分类很好。 您能否指出问题可能出在哪里?