贝叶斯分类器

时间:2014-04-14 09:35:27

标签: machine-learning classification bayesian

enter image description here

您好, 我在派生贝叶斯分类器时感到很困惑。通常情况下,我会遇到类似上面的问题,以便得到红点和绿点的数量,并计算特征分布F(X)。但是当我得到如下的二进制分布图时,我怎么能这样做呢?

enter image description here

这里的类变量Y∈(红色,蓝色)和特征变量X∈(-4,4)。 P(X,Y)的联合分布如图所示。 (P(X,Y =蓝色)和P(X,Y =红色))。现在,我如何推导和绘制特征分布P(X)。

1 个答案:

答案 0 :(得分:0)

直观地说,P(X)取决于P(Y)并不难。例如,如果P(Y=blue) = 1,那么

P(X) = P(X | Y=blue)

(换句话说,如果你知道Y是蓝色的,那么X的概率密度图是由你发布的蓝色图给出的)。 同样,如果P(Y=red) = 1,那么

P(X) = P(X | Y=red)

由于Y是二进制类变量,因此可以通过单个概率P(Y=blue) = p指定其分布,因为这意味着P(Y=red) = q = 1-p

鉴于上述结果,不难相信如果P(Y=blue)不是1,那么P(X)应该是P(X | Y=blue)P(X | Y=red)的混合。事实上, 它应该是一个线性混合物是有道理的:

P(X) = p * P(X | Y=blue) + q * P(X | Y=red)

你可以证明使用Bayes' Theorem

P(X) * P(Y=blue | X) = P(Y=blue) * P(X | Y=blue)

P(X) * P(Y=red | X) = P(Y=red) * P(X | Y=red)

将两条线加在一起,

P(X) * [P(Y=blue | X) + P(Y=red | X)] = P(Y=blue) * P(X | Y=blue) + P(Y=red) * P(X | Y=red)

由于Y必须为红色或蓝色,P(Y=blue | X) + P(Y=red | X)必须等于1,因此括号中的表达式会消失,您会得到:

P(X) = P(Y=blue) * P(X | Y=blue) + P(Y=red) * P(X | Y=red)

P(X) = p * P(X | Y=blue) + q * P(X | Y=red)