我有一个庞大的数据集,其中包含数值变量和分类变量。我遇到了各种各样的功能选择技术,这些技术主要集中在数值或分类数据上,而不是混合使用。是否有适用于此类数据集的特征选择技术?
答案 0 :(得分:0)
您正在寻找最初用R编写但也可以在python中使用的Boruta软件包。 Boruta使用随机森林对要素进行排名,但是您首先必须处理要素中所有缺失的值,否则Boruta会引发错误。在这里查看更多信息:
https://datascience.stackexchange.com/questions/31112/boruta-feature-selection-package