我使用Azure Machine Learning Studio来预测使用两级Boosted决策树和拆分数据的列。
我已经汇总的图表可以在这里找到:
我需要的是,我希望看到数据集中的列最能影响和影响预测。换句话说,更改预测结果的列比数据集中的其他列更多。
很抱歉,如果之前有人问过,但我找不到这个简单问题的正确答案。
答案 0 :(得分:0)
决策树的大多数ML实现包括称为" 功能重要性"在它的模型中。例如,Scikit Learn Decision Tree Classifier具有指示每个要素的重要性的属性。
Azure ML实现也不例外。请查看以下链接Permutation Feature Importance。
答案 1 :(得分:0)
如前所述,置换特征重要性可以解决问题。附加置换特征重要性块执行列车块,单击输出端口,然后选择可视化以获取模块的结果。上图显示了按其排列重要性分数降序排序的要素列表。
建议:当您具有高相关特征时,在解释排列分数的结果时要小心。
有关详细信息,请参阅: https://standupdata.com/category/permutation-feature-importance/ https://gallery.cortanaintelligence.com/Experiment/Permutation-Feature-Importance-5