我正在撰写过去的试卷。给我一个数据集如下:
头发{棕色,红色} = {B,R}, 身高{tall,short} = {T,S}和 国家{英国,意大利} = {U,I}
(B,T,U)(B,T,U)(B,T,I)
(R,T,U)(R,T,U)(B,T,I)
(R,T,U){R,T,U)(B,T,I)
(R,S,U)(R,S,U)(R,S,I)
问题:估计概率P(B,T | U),P(B | U),P(T | U),P(U)和P(I)
正如问题所述估计,我猜我不需要计算任何值。仅仅是将P(B,T | U)出现在整个数据集上的次数加起来的情况,例如(2/12)= 16%。
那么P(U)的概率是0?
答案 0 :(得分:0)
我不这么认为。在您的12条记录中,有8条来自英国。所以P(U)应该是8/12 = 2 / 3~ = .66
贝叶斯定理是P(A | B)= P(B | A)P(A)/ P(B),你需要估计其中一些概率。