Question

enter image description here

您好，我在派生贝叶斯分类器时感到很困惑。通常情况下，我会遇到类似上面的问题，以便得到红点和绿点的数量，并计算特征分布F（X）。但是当我得到如下的二进制分布图时，我怎么能这样做呢？

enter image description here

这里的类变量Y∈（红色，蓝色）和特征变量X∈（-4,4）。 P（X，Y）的联合分布如图所示。（P（X，Y =蓝色）和P（X，Y =红色））。现在，我如何推导和绘制特征分布P（X）。

Answer 1

直观地说，P(X)取决于P(Y)并不难。例如，如果P(Y=blue) = 1，那么

P(X) = P(X | Y=blue)

（换句话说，如果你知道Y是蓝色的，那么X的概率密度图是由你发布的蓝色图给出的）。同样，如果P(Y=red) = 1，那么

P(X) = P(X | Y=red)

由于Y是二进制类变量，因此可以通过单个概率P(Y=blue) = p指定其分布，因为这意味着P(Y=red) = q = 1-p。

鉴于上述结果，不难相信如果P(Y=blue)不是1，那么P(X)应该是P(X | Y=blue)和P(X | Y=red)的混合。事实上，它应该是一个线性混合物是有道理的：

P(X) = p * P(X | Y=blue) + q * P(X | Y=red)

你可以证明使用Bayes' Theorem：

P(X) * P(Y=blue | X) = P(Y=blue) * P(X | Y=blue)

P(X) * P(Y=red | X) = P(Y=red) * P(X | Y=red)

将两条线加在一起，

P(X) * [P(Y=blue | X) + P(Y=red | X)] = P(Y=blue) * P(X | Y=blue) + P(Y=red) * P(X | Y=red)

由于Y必须为红色或蓝色，P(Y=blue | X) + P(Y=red | X)必须等于1，因此括号中的表达式会消失，您会得到：

P(X) = P(Y=blue) * P(X | Y=blue) + P(Y=red) * P(X | Y=red)

P(X) = p * P(X | Y=blue) + q * P(X | Y=red)