我正在阅读this关于图像分割的论文。在本文的附录中,给出了通过使能量E(x)最小化来获得图像的二进制标记X = {xp} [Boykov and Jolly 2001]
其中λ是权重(在所有实验中均设置为60),Ed(xp)是数据项,当像素p的标签为xp(1-前景,0-背景),而Ec( xp,xq)是对比度项,表示两个相邻像素p和q的标记成本。我们使用以下对比项:Ec(xp,xq)= | xp − xq | ·(β·|| Ip-Iq || +ε)^-1,其中ε= 0.05,β=⟨|| Ip-Iq || ^2⟩^ -1 [Blake等。 2004]。 ⟨·⟩是整个图像的期望算子。
方程的数据项Ed(xp)是
其中K是足够大的常数,Lfp = − ln pf(Ip),Lbp = − ln pb(Ip),SB是“硬”背景涂鸦(当用户扩展背景时绘制的涂鸦),而Ip是像素p处的图像颜色。
如果我缺少任何术语的定义,可以在论文中找到。
我无法理解其基本知识。假设用户单击图像上的点(x,y)。这一点如何计算二进制标签? (他们使用的是Boykov和Jolly Graph cut,类似于OpenCV中gcgraph.hpp文件中的GCGRAPH类)