我想在Weka中执行属性选择,但我的数据集相当大,程序运行了很长时间。这就是我希望看到当前最佳属性集的原因。我该怎么做? 例如,遗传搜索具有"报告频率"参数,但是在整个搜索完成后显示所有结果,这不是我需要的。
没有进度条,所以我甚至不知道我需要等多久......
答案 0 :(得分:1)
特征或属性选择是数据挖掘和机器学习领域的标准问题。
如果要选择一组良好的属性,则必须通过根据质量对属性进行排名来预处理您的数据。 排名方法,例如 p-metric 或 t-statistic 很受欢迎,它们基于统计指标。人们不能简单地通过从一个大集合中随机选择属性而对属性的性质没有任何直觉。
答案 1 :(得分:0)
如果您不需要在整个数据集上运行属性选择,则可以使用较小的数据集样本(只需编辑ARFF文件)来运行属性选择。