我有一个关于在WEKA中过滤属性的简单问题。
假设我有500个属性,每个类有30个类和100个样本,等于3000行和500列。这会导致时间和记忆问题,你可以猜到。
如何过滤在3000行中仅发生一次或两次(或n次)的属性。这是一个好主意吗?
谢谢
答案 0 :(得分:6)
使用以下过滤器
weka.filters.unsupervised.attribute.RemoveUseless
此过滤器会删除完全不变或变化太大的属性。将自动删除所有常量属性,以及超出方差参数的最大百分比的任何属性。