我正在处理分类问题。我有大约1000个功能,目标变量有2个类。所有1000个要素的值都为1或0。我试图找到要素重要性,但是我的要素重要性值在0.0-0.003之间变化。我不确定这么低的值是否有意义。
有没有办法提高功能的重要性。
intent.getIntExtra("CardID", 0);
我将非常感谢您的帮助!谢谢
答案 0 :(得分:0)
由于只有两个目标类,因此您可以执行不等方差t检验,当所有其他特征分级方法使我无法通过时,该检验对于查找二进制分类任务中的重要特征很有用。您可以使用scipy.stats.ttest_ind
function来实现。基本上,这是一个统计测试,用于检查两个分布是否不同。如果返回的p值小于0.05,则可以认为它们是不同的分布。要实现每个功能,请按照以下步骤操作:
或者,您可以对所有特征执行此操作,并将p值用作特征重要性的度量。 p值越低,特征的重要性越高。
干杯!