标签: neural-network data-mining decision-tree prediction
我正在尝试使用NN / Decision Tree构建预测模型。我有一大堆变量,所以我试图进行特征选择(删除不需要的变量)。可以删除具有高偏度的变量(不正常分布)吗?它会对构建的模型产生影响吗?
答案 0 :(得分:0)
如果变量偏斜并不意味着它是坏的。
正态分布式数据也可能只是随机值。
但是对于许多方法,您需要花费更多时间为最佳性能预处理偏斜变量。但是,是什么让你认为仅仅因为它们是偏斜的而将它们排除在外是个好主意?