标签: machine-learning data-mining data-science feature-selection
我目前正在处理数据集。 95k +行和约481列。我试图通过数据集(线性回归)中的人口统计特征来预测收入。我只限制了15个功能。
我知道一个模型与你提供的功能一样好,但是我在选择正确的\最佳功能时遇到了问题,同时放弃了多余的功能,并且#34;嘈杂的"一个(不是全部都是数字)。什么是接近这项任务的好方法?使用R语言。