如何实现分类变量的特征选择?

时间:2019-03-22 08:49:10

标签: python random-forest feature-selection

选择重要功能时遇到问题。数据集的特征是分类的和数字的。目标变量为False或True。数据集的特征大约有100个,因此我需要删除一些与目标变量无关的特征。除了随机森林特征重要性之外,可以使用哪种方法?我正在使用Python。在R中,我可以使用Boruta包来选择重要的功能。但是我不知道如何在Python中做到这一点。

1 个答案:

答案 0 :(得分:0)

可以通过计算与假设有关的特征的P值来选择相关特征,请选中https://towardsdatascience.com/feature-selection-correlation-and-p-value-da8921bfb3cf