我在理解渐进式Horn和Schunck方法的渐变方式方面遇到了问题(实际上,不仅仅是针对该方法,更常见的是用于光流/可变形图像配准的迭代优化方法)。我在这里使用Horn和Schunck的例子,因为在那里我可以参考一篇文章来说明我不清楚的事情。
我正在阅读以下论文http://campar.in.tum.de/pub/zikic2010revisiting/zikic2010revisiting.pdf,其中指出增量Horn和Schunck方法实际上与在原始问题上使用Gauss-Newton优化方案相同。在增量Horn和Schunck中,使用一个Horn和Schunck迭代的解决方案作为下一个的初始估计:位移场用于扭曲源图像,然后下一个Horn和Schunck迭代用于计算增量步长。然后,添加初始估计和步骤,并将其用作下一次迭代的初始化。到目前为止,这么好,人们可以做到这一点,即使我不会说这是直截了当的分裂事情并将它们重新组合在一起应该是正确的。
现在论文指出这种(乍一看启发式)方法可以推导为高斯 - 牛顿优化,这意味着它应该有更多的数学基础。现在我找到了一个我不止一次遇到的主题,但无法推理:
在术语
中IT(x)的-IS(X + U(X))
,IT是目标图像,IS是源图像,U(x)是优化的变形域。
当围绕某个当前变形场值U(x)线性化该能量项时(在论文中它是方程式19,我稍微改变了它),我们得到一个步骤h(x)
线性化(H(X))≡IT(x)的-IS(X + U(X)) - 研究所(为(x + U(X)))* H(X)
现在问题是:什么是grad(IS(x + U(x)))?作者认为,这将是与增量Horn和Schunck方法相同的梯度,但是:我想说,梯度需要采用U(x)。这意味着我将在位置x + U(x)处取IS的数值梯度。但是,我现在经常看到,根据U(x)扭曲图像,然后在位置x处拍摄变形图像的数值梯度。这似乎也是增量Horn和Schunck所做的事情,然而,这对我来说似乎不正确。
这是一个没有人谈论的近似值吗?我错过了什么吗?或者,当我反复优化光学流程时,我使用扭曲图像的数值梯度看到的所有实现只是做错了吗?
非常感谢任何可以帮助我开悟的人。