标签: feature-selection rfe
我在7800个样本上具有145个功能,并且尝试使用RFECV训练高斯朴素贝叶斯,逻辑回归和线性SVM。
从上图可以看出,LR和SVM模型都开始停滞在30至40个特征之间。这是过拟合的迹象吗?由于RFECV只会告诉您获得最高准确度的功能集,因此仍然为这两个模型提供了140个功能。 30到140个功能之间只有很小的精度差异,那么在这里最明智的做法是什么?我是否仅应用了朴素贝叶斯在LR和SVM上具有的相同数量的功能(本例中为39个功能)?
谢谢