增加功能重要性

时间:2018-09-24 17:08:13

标签: python machine-learning classification random-forest

我正在处理分类问题。我有大约1000个功能,目标变量有2个类。所有1000个要素的值都为1或0。我试图找到要素重要性,但是我的要素重要性值在0.0-0.003之间变化。我不确定这么低的值是否有意义。

有没有办法提高功能的重要性。

intent.getIntExtra("CardID", 0);

我将非常感谢您的帮助!谢谢

1 个答案:

答案 0 :(得分:0)

由于只有两个目标类,因此您可以执行不等方差t检验,当所有其他特征分级方法使我无法通过时,该检验对于查找二进制分类任务中的重要特征很有用。您可以使用scipy.stats.ttest_ind function来实现。基本上,这是一个统计测试,用于检查两个分布是否不同。如果返回的p值小于0.05,则可以认为它们是不同的分布。要实现每个功能,请按照以下步骤操作:

  1. 分别提取1类和2类的所有预测变量值。
  2. 在这两个分布上运行test_ind,指定它们的方差未知,并确保它是两条尾巴的t检验
  3. 如果p值小于0.05,则此功能很重要。

或者,您可以对所有特征执行此操作,并将p值用作特征重要性的度量。 p值越低,特征的重要性越高。

干杯!