您好, 我在派生贝叶斯分类器时感到很困惑。通常情况下,我会遇到类似上面的问题,以便得到红点和绿点的数量,并计算特征分布F(X)。但是当我得到如下的二进制分布图时,我怎么能这样做呢?
这里的类变量Y∈(红色,蓝色)和特征变量X∈(-4,4)。 P(X,Y)的联合分布如图所示。 (P(X,Y =蓝色)和P(X,Y =红色))。现在,我如何推导和绘制特征分布P(X)。
答案 0 :(得分:0)
直观地说,P(X)
取决于P(Y)
并不难。例如,如果P(Y=blue) = 1
,那么
P(X) = P(X | Y=blue)
(换句话说,如果你知道Y是蓝色的,那么X
的概率密度图是由你发布的蓝色图给出的)。
同样,如果P(Y=red) = 1
,那么
P(X) = P(X | Y=red)
由于Y
是二进制类变量,因此可以通过单个概率P(Y=blue) = p
指定其分布,因为这意味着P(Y=red) = q = 1-p
。
鉴于上述结果,不难相信如果P(Y=blue)
不是1,那么P(X)
应该是P(X | Y=blue)
和P(X | Y=red)
的混合。事实上,
它应该是一个线性混合物是有道理的:
P(X) = p * P(X | Y=blue) + q * P(X | Y=red)
你可以证明使用Bayes' Theorem:
P(X) * P(Y=blue | X) = P(Y=blue) * P(X | Y=blue)
P(X) * P(Y=red | X) = P(Y=red) * P(X | Y=red)
将两条线加在一起,
P(X) * [P(Y=blue | X) + P(Y=red | X)] = P(Y=blue) * P(X | Y=blue) + P(Y=red) * P(X | Y=red)
由于Y
必须为红色或蓝色,P(Y=blue | X) + P(Y=red | X)
必须等于1,因此括号中的表达式会消失,您会得到:
P(X) = P(Y=blue) * P(X | Y=blue) + P(Y=red) * P(X | Y=red)
P(X) = p * P(X | Y=blue) + q * P(X | Y=red)