我有一个随机森林分类器,该分类器为我提供了特征重要性等级。
我如何得出重要特征的统计显着性,类似于可以推断beta的统计显着性的回归模型?
答案 0 :(得分:0)
您的问题有点过于笼统和不清楚。
您可以通过将其值归一化来查看feature_importance_
值百分比的一种简单方法:
importance_sum = sum(clf. feature_importances_)
feature_importance_as_percent = [100*(x/sum) for x in clf.feature_importances_]
其他方法可能涉及参数或非参数测试。
另请阅读:How are feature_importances in RandomForestClassifier determined?