根据[Teh,2007]处理Dirichlet过程时,DP被定义为基本概率H和比例因子“alpha”
根据Stick Breaking Construction,随机从DP中绘制G:
G〜DP(α,1H)
由下列人员给出:
G =从(1到无穷大)k的总和(pi_k * delta_theta_k)
pi_k是根据单一棍子的长度从Beta分布中有序绘制的
delta_theta_k是以“theta_k”为中心的点质量(theta_k是从基础分布中随机抽取)
我对所有变量都有一个清晰的理解,但我不知道它们是什么意思“质量点”是它的概率密度,还是别的东西。
如果你能把我指向任何方向,那将是很棒的,只有参考会是惊人的。
由于
答案 0 :(得分:1)
G是概率分布的概率分布。这些(子)概率分布在某个域上,我们称之为BigTheta。
每个theta_k都是来自BigTheta上的分布,因此它是BigTheta的一些元素。
每个delta_theta_k是BigTheta上的概率分布,定义为delta_theta_k(theta_k)= 1和delta_theta_k(其他任何东西)= 0.这就是他们所谓的“点质量”分布,因为分布的所有质量都是在域的一个点上。
G是BigTheta上概率分布的概率分布,定义为:对于BigTheta上的一些分布,称为f(由theta参数化),G(f(theta))= sum(pi_k * delta_theta_k(theta))。
我希望有所帮助,我认为你通常有正确的想法,只是符号可以变得有点复杂(并且SO不是这种符号的最佳选择)。无论何时遇到符号来思考它是什么类型的函数,即它定义的是什么,它通常都是有用的。