我似乎无法找出预处理标签中的属性选择过滤器做了什么?有人可以用简单的语言告诉我,我是weka的新手
当我将它应用于我的数据集时,似乎删除了一些属性,但我不确定为什么
答案 0 :(得分:1)
真实数据集可能包含许多属性。在此数据集上应用任何数据挖掘过程(例如,查找群集,生成分类模型......)可能需要很长时间。
除此之外,我们可以选择一些名为the most discriminative attributes
的属性(维度)。这些属性几乎可以描述具有较少数量属性的数据集,这将加速对数据执行的任何过程。
“属性选择”选项卡包含许多用于选择这些属性的不同方法。其中一个是CFS Feature Set Evaluation这个过滤器为您提供了与类标签具有更高相关性的属性,这使得它们成为有区别的属性。