具有连续和分类特征的数据的特征选择?

时间:2020-06-03 08:55:22

标签: machine-learning feature-selection

同时具有数字和分类特征时,如何执行特征选择?将特征划分并分别探索相关性是否很常见(例如,选择我的分类特征并使用卡方,然后选择连续并使用ANOVA?)

1 个答案:

答案 0 :(得分:0)

通常-否。如果使用信息增益进行特征选择,则首先需要通过离散化将连续属性转换为名义属性。属性的标称值数量会极大地影响信息获取-因为您拥有的标称值越多,解释目标变量的机会就越大。确保每个属性的值数量大致相同,并且使用的信息获取率相对于值的数量及其概率对信息增益进行归一化。