为什么马尔可夫随机场中的推理很难?

时间:2017-02-05 01:31:19

标签: machine-learning markov-random-fields

我正在研究马尔可夫随机场,而且,显然,MRF中的推理是硬/计算上昂贵的。具体而言,Kevin Murphy的书“机器学习:概率观”中说明如下:

"在第一项中,我们将y固定为其观测值;这有时被称为钳位术语。在第二学期,y是免费的;这有时被称为未夹紧术语或对比术语。 请注意,计算未展开的术语需要在模型中进行推理,并且每个渐变步骤必须执行一次。这使得训练无向图形模型比训练定向图形模型更难。"

为什么我们在这里进行推理?我知道我们总结了所有y,这看起来很昂贵,但我不知道我们在哪里实际估算任何参数。维基百科也讨论推理,但只讨论计算条件分布,并且需要总结所有非指定节点......但是......这不是我们在这里做的,是吗?

或者,任何人都很清楚为什么MRF中的推理很困难?

来源: ML:PP的第19章:https://www.cs.ubc.ca/~murphyk/MLbook/pml-print3-ch19.pdf

下面的具体部分

enter image description here

1 个答案:

答案 0 :(得分:1)

在训练CRF时,您需要估算参数\theta

为了做到这一点,你可以将损失函数(公式19.38)与\theta区分开,将其设置为0,并求解\theta

如果你这样做,你不能解析地解决\theta的等式。但是,您可以通过梯度下降最小化方程19.38。由于损失函数是凸的,因此可以保证梯度下降在收敛时为您提供全局最优解。

公式19.41是您需要计算的实际梯度,以便能够进行梯度下降。当你总结y的观察值时,第一个术语很容易计算(并且计算上很便宜)。但是,第二学期要求您进行推理。在这个术语中,你并没有像第一学期那样总结y的观测值。相反,您需要计算y(推理)的配置,然后计算此配置下潜在函数的值。