如何裁剪图像的roi

时间:2012-12-05 14:42:24

标签: opencv crop roi

在我的项目中,我想裁剪图像的ROI。为此,我创建了一个具有极端区域的地图。现在我想裁剪具有最重要像素的区域(黑色不重要,白色很重要)。

有人知道如何实现它吗?我认为这是一个最大化的问题 下图中的红色边框是我想要裁剪此图像的示例 image

1 个答案:

答案 0 :(得分:5)

如果我正确理解了您的问题,您已经在图像中的每个点计算了一个值。这些值表明每个点的“重要性”/“有趣性”/“显着性”。包含这些值的矩阵/图像是您指的“地图”。您的目标是获得具有高“重要性”分数的兴趣区域(ROI)的边界框。

我认为您可以分析投资回报率的方法是使用基于图形切割的分段,使用您的重要性图在每个像素上计算“得分”。分割的结果是掩盖“重要”像素的二元掩模。接下来,在此二进制掩码上运行OpenCV的findcontours函数以获取各个连接的组件。然后在findContours(...)返回的轮廓上使用OpenCV的boundingRect函数来获取边界框。

以这种方式使用基于图形切割的分割算法的好处是,它将连接碎片组件,即即使您的“重要性”映射有噪声,生成的二进制掩码也不会有小漏洞。< / p>

已在OpenCV中实现的一种基于图切割的分割算法是GrabCut算法。一个快速的黑客将它应用于你的“重要性”地图,以获得我上面提到的二进制掩码。更复杂的方法是使用“重要性”映射构建前景和背景(颜色可能是?)模型,并将其作为输入传递给函数。有关OpenCV中GrabCut的更多详细信息,请访问:http://docs.opencv.org/modules/imgproc/doc/miscellaneous_transformations.html?highlight=grabcut#void grabCut(InputArray img, InputOutputArray mask, Rect rect, InputOutputArray bgdModel, InputOutputArray fgdModel, int iterCount, int mode)

如果您希望获得更大的灵活性,可以使用以下MRF库来破解您自己的基于图切割的分割算法。此库允许您在计算图形切割时指定自定义目标函数:http://vision.middlebury.edu/MRF/code/

要使用MRF库,您需要在图像中的每个点指定“成本”,指示该点是“前景”还是“背景”。您还可以将这种二分法视为“重要”或“不重要”,而不是“前景”与“背景”。 MRF库的目标是在每个点返回一个标签,以便分配这些标签的总成本尽可能小。因此,游戏的目的是为你认为重要的点计算一个小成本,否则就会很大。

具体而言,每个点的成本由2部分组成:1)数据项/功能和2)平滑项/功能。如前所述,每个点的数据项越小,选择点的可能性就越大。如果您的“重要性”得分s_ij在[0,1]范围内,那么计算数据项的常用方法是-log(s_ij)。

平滑项是一种表示2个相邻像素p,q是否应具有相同标签的方式,即“前景”,“背景”或一个“前景”和另一个“背景”。与数据成本类似,您必须构建它,使得具有相似“重要性”分数的相邻像素的成本很小,以便为它们分配相同的标签。这个术语负责“平滑”所得到的蒙版,这样你就不会在高“重要性”区域内散布低“重要性”的像素,反之亦然。如果有这样的区域,OpenCV上面提到的findContours(...)函数将返回这些区域的轮廓,可以通过检查它们的大小来过滤掉这些区域。

有关计算成本的功能的详细信息,请参阅GrabCut论文:GrabCut

此博客文章提供了有关在OpenCV中创建自己的图切割分割算法的更多详细信息(和代码):http://www.morethantechnical.com/2010/05/05/bust-out-your-own-graphcut-based-image-segmentation-with-opencv-w-code/

另一篇论文展示了如何在GrabCut论文中使用更好的符号来处理灰度图像(您的情况)上的图形切割分割,以及没有复杂的图像消光部分(未在OpenCV版本中实现):Graph Cuts and Efficient N-D Image Segmentation

希望这有帮助。