如何查看最能影响预测结果的列?

时间:2017-09-09 16:39:31

标签: azure machine-learning azure-machine-learning-studio

我使用Azure Machine Learning Studio来预测使用两级Boosted决策树和拆分数据的列。

我已经汇总的图表可以在这里找到:

enter image description here

我需要的是,我希望看到数据集中的列最能影响和影响预测。换句话说,更改预测结果的列比数据集中的其他列更多。

很抱歉,如果之前有人问过,但我找不到这个简单问题的正确答案。

2 个答案:

答案 0 :(得分:0)

决策树的大多数ML实现包括称为" 功能重要性"在它的模型中。例如,Scikit Learn Decision Tree Classifier具有指示每个要素的重要性的属性。

Azure ML实现也不例外。请查看以下链接Permutation Feature Importance

答案 1 :(得分:0)

如前所述,置换特征重要性可以解决问题。附加置换特征重要性块执行列车块,单击输出端口,然后选择可视化以获取模块的结果。上图显示了按其排列重要性分数降序排序的要素列表。 Importance Score output

建议:当您具有高相关特征时,在解释排列分数的结果时要小心。

有关详细信息,请参阅: https://standupdata.com/category/permutation-feature-importance/ https://gallery.cortanaintelligence.com/Experiment/Permutation-Feature-Importance-5