递归特征消除(对所有特征都具有相似的重要性)

时间:2020-08-05 14:45:58

标签: machine-learning scikit-learn random-forest

我正在尝试使用10个分类变量(均从1到10的相同比例)将模型拟合到分类变量(3个级别=低,中,高)上。我使用随机森林运行递归特征消除(RFE),结果是所有变量的重要性相似(每个变量约10%)。我期待一个主要变量,但事实并非如此。如何解释呢?我应该尝试以其他方式建模还是仅仅是数据的本质?

PS:我运行了一个corr矩阵,所有10个特征与目标变量的相关度都很低。如果是这种情况,我是否应该认为在相关性较低的情况下,没有哪个变量可以控制重要性?

1 个答案:

答案 0 :(得分:1)

从技术上讲,是的,可能所有属性都有同等的影响。这种平等是否有意义只能用对特定数据集或域的“洞察力知识”来回答。