如何识别WEKA的相关功能?

时间:2013-12-12 07:44:49

标签: optimization weka feature-selection

我想在WEKA中进行特征分析。我有一个包含8个功能和65个实例的数据集。

我想执行可用于SVM等机器学习方法的特征选择和优化功能。 例如,在Weka中,我想知道如何显示哪些特征对分类结果有最大贡献。

我认为WEKA提供了一个漂亮的图形用户界面,可以对单个功能的影响进行非常详细的分析。但我不知道如何使用它。有什么帮助吗?

1 个答案:

答案 0 :(得分:3)

您有两种选择:

  • 您可以使用过滤器执行属性选择。例如,您可以将AttributeSelection标签(或过滤器)与搜索方法Ranker和属性评估指标InfoGainAttributeEval一起使用。这样,您可以根据其信息增益得分获得最具预测性功能的排名列表。我已经多次这样做了很好的结果。有时它甚至有助于提高SVM的准确性,已知SVM不需要(太多)特征选择。您可以尝试使用其他搜索方法来查找耦合预测变量的子组以及其他指标。

  • 您可以查看SVM输出中的系数。例如,在线性SVM中,分类器是多项式,如a1.f1 + a2.f2 + ... + an.fn + fn+1 > 0ai是实例的属性值,fi是在SVM训练算法中获得的“权重”。因此,值接近0的权重代表不太重要的属性,因此是不好的预测因子;极端权重(正面或负面)代表良好的预测因素。

此外,您可以检查特定分类器可用的可视化选项(例如,J48是决策树,根测试中使用的属性是最佳预测器)。您也可以查看AttributeSelection选项卡可视化选项。