opencv - 如何裁剪图像的roi

如果我正确理解了您的问题，您已经在图像中的每个点计算了一个值。这些值表明每个点的“重要性”/“有趣性”/“显着性”。包含这些值的矩阵/图像是您指的“地图”。您的目标是获得具有高“重要性”分数的兴趣区域（ROI）的边界框。

我认为您可以分析投资回报率的方法是使用基于图形切割的分段，使用您的重要性图在每个像素上计算“得分”。分割的结果是掩盖“重要”像素的二元掩模。接下来，在此二进制掩码上运行OpenCV的findcontours函数以获取各个连接的组件。然后在findContours（...）返回的轮廓上使用OpenCV的boundingRect函数来获取边界框。

以这种方式使用基于图形切割的分割算法的好处是，它将连接碎片组件，即即使您的“重要性”映射有噪声，生成的二进制掩码也不会有小漏洞。< / p>

已在OpenCV中实现的一种基于图切割的分割算法是GrabCut算法。一个快速的黑客将它应用于你的“重要性”地图，以获得我上面提到的二进制掩码。更复杂的方法是使用“重要性”映射构建前景和背景（颜色可能是？）模型，并将其作为输入传递给函数。有关OpenCV中GrabCut的更多详细信息，请访问：http://docs.opencv.org/modules/imgproc/doc/miscellaneous_transformations.html?highlight=grabcut#void grabCut(InputArray img, InputOutputArray mask, Rect rect, InputOutputArray bgdModel, InputOutputArray fgdModel, int iterCount, int mode)

如果您希望获得更大的灵活性，可以使用以下MRF库来破解您自己的基于图切割的分割算法。此库允许您在计算图形切割时指定自定义目标函数：http://vision.middlebury.edu/MRF/code/

要使用MRF库，您需要在图像中的每个点指定“成本”，指示该点是“前景”还是“背景”。您还可以将这种二分法视为“重要”或“不重要”，而不是“前景”与“背景”。 MRF库的目标是在每个点返回一个标签，以便分配这些标签的总成本尽可能小。因此，游戏的目的是为你认为重要的点计算一个小成本，否则就会很大。

具体而言，每个点的成本由2部分组成：1）数据项/功能和2）平滑项/功能。如前所述，每个点的数据项越小，选择点的可能性就越大。如果您的“重要性”得分s_ij在[0,1]范围内，那么计算数据项的常用方法是-log（s_ij）。

平滑项是一种表示2个相邻像素p，q是否应具有相同标签的方式，即“前景”，“背景”或一个“前景”和另一个“背景”。与数据成本类似，您必须构建它，使得具有相似“重要性”分数的相邻像素的成本很小，以便为它们分配相同的标签。这个术语负责“平滑”所得到的蒙版，这样你就不会在高“重要性”区域内散布低“重要性”的像素，反之亦然。如果有这样的区域，OpenCV上面提到的findContours（...）函数将返回这些区域的轮廓，可以通过检查它们的大小来过滤掉这些区域。

有关计算成本的功能的详细信息，请参阅GrabCut论文：GrabCut

此博客文章提供了有关在OpenCV中创建自己的图切割分割算法的更多详细信息（和代码）：http://www.morethantechnical.com/2010/05/05/bust-out-your-own-graphcut-based-image-segmentation-with-opencv-w-code/

另一篇论文展示了如何在GrabCut论文中使用更好的符号来处理灰度图像（您的情况）上的图形切割分割，以及没有复杂的图像消光部分（未在OpenCV版本中实现）：Graph Cuts and Efficient N-D Image Segmentation

希望这有帮助。

如何裁剪图像的roi

1 个答案: