朴素贝叶斯密度估计

时间:2016-06-05 14:52:36

标签: machine-learning naivebayes probability-density

我目前正在攻读机器学习考试,经过大量的谷歌搜索和学习幻灯片后,我还不完全确定一个朴素的贝叶斯密度估算器是如何工作的。有人可以向我解释一下吗?这门课程仍然非常基础,所以如果可能的话,请保持简单:)

这是旧考试中的一个问题,我被困在了:

对于" Win"在表1中训练的幼稚贝叶斯密度估算器会是什么?类预测一个案例(x1 = I,x3 = C)?

表1:

enter image description here

答案很明显:(3/5)*(1/5)= 0,12。但3/5和1/5来自哪里?

感谢您的帮助!

1 个答案:

答案 0 :(得分:1)

朴素贝叶斯使用两个假设:

  • 功能在给定类
  • 时是独立的
  • 每个特征都来自一些已知的apriori密度族

它给了我们什么?首先让我们使用第一个假设

P(x1=I, x3=C | y = Win) = P(x1=I | y=Win) P(x3=C | y=Win)

现在我们必须将每个"小"概率,我们在这里使用条件概率的定义和天真的频率方法,通过估计

               P(x=A, y=B)   # samples having x=A and y=B
P(x=A | y=B) = ----------- = ----------------------------
                  P(y=B)         # samples having y=B

\________________________/
   definition of P(a|b)

               \________________________________________/
                    estimator for the assumed family

从而

P(x1=I | y=Win) = 3/5
P(x3=C | y=Win) = 1/5