在Azure ML中训练决策树时,是否有办法查看每个功能的熵/信息增益?
答案 0 :(得分:1)
传统节点性能:
目前,您只能在提升的决策树模型中查看gini的相对增益。右键单击并可视化训练的提升决策树的输出,下面链接的图像。从那以后,等待树木加载。然后,您可以单击每个树的节点以查看每个级别的拆分增益。
熵/信息增益:
虽然让我们退后一步,问我们为什么要查看熵?熵是单个树中的节点特定度量。 Azure机器学习没有单个树分类器,例如R中的rpart,只有决策林,决策丛林和提升决策树模块形式的树的集合。
变量重要性:
因此,我猜你正在寻找变量/特征重要性测量,这是整体内所有树中所有节点分裂的整体gini /熵/信息增益的聚合或平均值。 Azure ML有一个模块,可以通过称为置换特征重要性模块的训练算法计算特征重要性。它的工作原理是通过训练模型运行随机预测值,以查看响应类更改的幅度。