所以我有一个2304 数字属性和类属性的大型数据集,我想执行特征选择以删除误导和冗余属性。这是因为我将运行离散化以使它们成为名义上的,然后在数据集上运行NaïvesBayes。
但是,在Weka的select attributes选项卡中,它只按排名顺序列出它们。我知道预处理选项卡中有一个删除过滤器,但它只包含一个或多个属性。
是否有一种自动删除方法,因为这么大的数据集?
答案 0 :(得分:0)
在“预处理”选项卡中, 选择AttributeSelection过滤器(受监督的属性过滤器)。 配置评估程序并根据需要进行搜索。 应用
这只会保留通过过滤器的那些(当然保留class属性)。 如果您喜欢结果,请将其另存为新的arff文件。