我在WEKA中的一些高维数据集上应用了特征选择算法,该算法基于对称不确定性给出了特征列表。现在我想消除那些具有0不确定性值的特征。但是数据集中有大约10,000个要素,因此无法手动消除所需的要素。是否有任何方法可以自动消除WEKA中的尺寸?
答案 0 :(得分:1)
如果要对归约的数据集执行分类,请使用AttributeSelectedClassifier。这将“分类器”包裹在属性选择算法中。
以及便利性的优势,这意味着属性选择是在交叉验证过程的内部中完成的,这样您就不会对分类器的性能产生过分乐观的估计-如果您这样做了首先选择属性,然后在简化后的数据集上建立分类器并对其进行交叉验证,您可能会通过在训练过程中泄漏一些有关验证数据集的知识来“作弊”。