我的这个集合具有持续值属性Temperature
和Play Tennis
的布尔值属性:
Temperature: 40 48 60 72 80 90
Play Tennis: No No Yes Yes Yes No
这是来自我引用的PPT:
我理解除最后一步之外的所有步骤,即信息增益计算。我了解如何计算54
和85
的候选阈值。但在下一张幻灯片中,它表示temp > 54
的信息增益被选为最佳信息。
但根据我对该示例的论文计算,我应该选择temp > 85
,因为它的增益值更高!
我的计算:
请原谅我用过的纸张。我只是在房间里看到的任何空白纸上进行计算,以避免浪费纸张。
基于此,我认为我迷失了方向。任何人都对他们如何提到temp > 54
被选为最佳信息获得有任何想法?