特征选择(如何解释结果)?

时间:2017-11-01 16:26:25

标签: python python-3.x machine-learning data-science feature-selection

假设我有一个数据集,我想要选择与预测结果相对应的功能。我已经实现了一些功能排名测试,结果如下:

enter image description here

对于预测模型,我选择了具有最佳“均值”值的特征。

X = oil_10[['Sidetrack Code','Well Type Code','Well Status  
Code','Producing Formation','Water Produced, bbl','County']]

以下是具有“最佳选择功能”的预测模型结果:

RandomForestRegressor
0.390502562474

这是预测模型的结果,所有数据集特征都没有任何选择:

RandomForestRegressor
0.741878611892

如何使用要素排名结果来实现最佳预测结果?

1 个答案:

答案 0 :(得分:0)

我试图用这种方式解决我的问题: 我刚刚删除了最不重要的特征(平均重要值小于0.15),精度保持不变75%,但现在预测模型的工作速度要快得多。