以前的试卷中有一个问题,我被要求查看;我们习惯学习的幻灯片没有理解这一点。我理解如何使用表来获取熵,但不知道如何使用提供的等式来实现这一目标
训练由属性A1,A2,A3和结果C表示的数据的决策树:
A1 A2 A3 C
1 0 1 0
0 1 1 1
0 0 1 0
对于log 2 (1/3)= 1.6且log 2 (2/3)= 0.6,请回答以下问题:
a)给定训练样例集的熵H值是多少?
b)按属性A2划分的正样本部分是什么?
c)属性A2的信息增益值G(A2)是多少?
d)决策树的IFTHEN规则是什么?
答案 0 :(得分:0)
我猜b部分将是3.就好像你在第1行或第3行的A2中加1,C会变为1.
对于第2行,如果从A2中删除1,则C将变为0。