我一直在单独使用一些特征选择方法,例如RED或Select K best,用于多标签分类。是否可以使用一种技术或方法动态选择特征选择方法?例如,根据测试数据的统计数据或一些基于规则的方法?
答案 0 :(得分:0)
这可能不是您正在寻找的答案,但您可以尝试每一个并根据某些测试数据进行交叉验证。编写脚本应该是相当简单的。
我不知道选择一种比这更好的特征选择算法的方法,但它会让你偏向于你使用过的测试数据。
答案 1 :(得分:0)
我对特征统计的假设是:类之间的值均值之间的最大距离和一个类的最小值的方差分类一个好的特征。
我从小学习集开始,测试这个假设并增加学习集,如果结果看起来很有希望。
最终的优化是均值比较的直方图。删除具有类似直方图的特征。这些是冗余功能,可以降低(至少在SVM上)精确度(5-10%)。
通过这种方法,我在5个类,600个实例的数据集上获得了95%的准确率。训练需要< 1H。经过多天的实验,人工培训增加了98%。