Rpart改进分数与信息增益

时间:2017-08-24 16:28:50

标签: r decision-tree rpart

我最近一直在使用RPART并进行了一项我不理解的计算。

在处理信息获取时,如何计算“改进”或变量重要性(从我的测试看,它们似乎相同)。

作为一个虚拟的例子,我尝试学习下表:

   happy,class
   yes,p
   no,n

使用命令:

fit <-rpart(class ~ happy,data=train,parms = list(split="information"),minsplit=0)

这很简单,并返回带有根的预期树,然后每个叶子包含一个元素。

如果这让人感到困惑,那么拆分的改进是1.386294。

我希望这里的改进是1(从熵1到儿童的熵0),我错过了什么?

1 个答案:

答案 0 :(得分:0)

好吧,回答这个问题,这是因为RPART正在使用自然日志。

因此,似乎改进分数是由节点中元素数量缩放的熵的改进。

根节点中的熵是:-ln(1/2)* 1/2 * 2 + -ln(1/2)* 1/2 * 2 = -ln(1/2)* 2 1.38。叶节点中的熵都是0。

为什么他们使用自然日志,我不知道。