Azure机器学习决策树熵/信息增益

时间:2016-03-09 08:07:05

标签: decision-tree cortana-intelligence azure-machine-learning-studio information-gain

在Azure ML中训练决策树时,是否有办法查看每个功能的熵/信息增益?

1 个答案:

答案 0 :(得分:1)

传统节点性能:

目前,您只能在提升的决策树模型中查看gini的相对增益。右键单击并可视化训练的提升决策树的输出,下面链接的图像。从那以后,等待树木加载。然后,您可以单击每个树的节点以查看每个级别的拆分增益。

Split Gain at Each Node

熵/信息增益:

虽然让我们退后一步,问我们为什么要查看熵?熵是单个树中的节点特定度量。 Azure机器学习没有单个树分类器,例如R中的rpart,只有决策林,决策丛林和提升决策树模块形式的树的集合。

变量重要性:

因此,我猜你正在寻找变量/特征重要性测量,这是整体内所有树中所有节点分裂的整体gini /熵/信息增益的聚合或平均值。 Azure ML有一个模块,可以通过称为置换特征重要性模块的训练算法计算特征重要性。它的工作原理是通过训练模型运行随机预测值,以查看响应类更改的幅度。

Permutation Feature Importance Module

相关问题