信息增益的负值

时间:2017-02-09 19:50:15

标签: algorithm machine-learning decision-tree entropy information-gain

我正在实施C4.5,在我的计算中我得到(例如某些例子)信息增益的负值。我读过Why am I getting a negative information gain,但我认为看起来不同。我把我的计算推高到excel,我得到的结果如下:

My calculations

我做错了什么?

我尝试再次计算它,并且我得到负值,如下图所示: Newest calculations with data set 80是分割值,所以我得到11< = 80和3个对象> 80

1 个答案:

答案 0 :(得分:0)

您是否将熵的结果乘以-1

$$ H(X)= - \ sum_ {i = 1} ^ n {\ mathrm {P}(x_i)\ log_b \ mathrm {P}(x_i)} $$

呃......在使用mathjax时出现问题,go here for definition