我在一个包含许多属性的庞大数据集上使用weka。 那么是否有可能自动应用特征选择的输出?无需手动删除数百个功能? (在资源管理器中)
如果有人知道,这将是一个加号: CLI的命令是什么? (我经常使用脚本来处理大量数据/分类器)
非常感谢!
答案 0 :(得分:1)
这很可能来自Explorer和CLI。
在“预处理”选项卡上的资源管理器中,有一个标记为“过滤器”的框。如果选择“选择”按钮,并在新窗口中展开某些文件夹,则可以找到有监督和无监督的属性过滤器。选择适当的过滤器后,您的选择将显示在“预处理过滤器”框中。您可以双击此框以显示一个窗口,其中包含允许您进一步定义过滤器的选项。此窗口还包含名为“更多”和“功能”的按钮,可让您了解有关所选过滤器的更多信息。
对于您的任务,一些好的过滤器可能是:
过滤器>监督>属性> AttributeSelction
这是一种应用一些内置的Weka属性选择过程的方法。
过滤器>无监督的>属性>删除
这将允许您提供要从数据集中删除的属性的索引。
要在CLI中实现这些属性过滤器和其他属性,我建议查看这两个来源。他们做的解释比我希望做的更好。