假设我们有一系列数字图像D1,...,Dn。确切地说,我们认为这些图像具有相同的大小。问题是要找到最大的公共区域 - 所有输入图像共享的最大区域。
我想如果我们有一个算法在两个输入图像A和B中检测这样的区域,我们可以将它推广到n个图像的情况。
此问题中最困难的是图像A中的这个区域不必相同,像素到像素,等于图像B中的相同区域。例如,我们用手机摄像头拍摄了两幢建筑物。我们的手震动了,第二张照片变得有些脱落。并且每张图片中出现的噪音也增加了不确定性。
我应该研究哪些算法来解决这类问题?
答案 0 :(得分:1)
简单但近似的解决方案,一开始。
重新缩放图像,使抖动的幅度小于像素。
计算所有图像中每个像素的标准偏差。
考虑偏差低于阈值的像素。
作为第二个近似值,您可以将全分辨率的图像用作模板,但仅限于上述获得的区域。然后相对于它注册其他图像。注册模型只能是平移的,但允许轮换会更好。
不幸的是,registration并非易事。对于你的小位移,Lucas-Kanade或Shi-Tomasi可能是合适的。
注册后,您可以重做偏差测试以获得更好的描绘区域。
答案 1 :(得分:1)
我会使用像SURF(或SIFT)这样的方法:你在每张图像上计算SURF,然后看看是否有共同的兴趣点。共同兴趣点将是您正在寻找的区域。由于SURF,该区域不必在同一个地方或规模。