Python OpenCV绑定中的copyTo等价物?

时间:2017-01-10 15:52:43

标签: python image opencv image-processing

OpenCV具有copyTo功能,可以将遮罩区域从一个Mat复制到另一个Mat。

http://docs.opencv.org/3.1.0/d3/d63/classcv_1_1Mat.html#a4331fa88593a9a9c14c0998574695ebb

Python绑定中的等价物是什么?我想用二进制掩码将图像区域复制到另一个图像。

2 个答案:

答案 0 :(得分:13)

cv::Mat::copyTo根据输出矩阵是否已初始化,执行以下两项操作之一。如果未初始化输出矩阵,则使用带掩码的copyTo将创建一个与输入类型相同的新输出矩阵,并且所有值都将在所有通道上设置为0。一旦发生这种情况,掩模定义的图像数据将被复制,矩阵的其余部分将被设置为0.如果输出矩阵 已初始化并且已由内容组成,{{1}复制掩码中从源定义的像素,并使不属于掩码的像素保留在目标中。因此,从源图像中替换由掩码定义的像素将被复制到输出。

因为OpenCV现在使用copyTo与库接口,所以很容易做到这两种方法。为了区别于本文中看到的另一个答案,第一种方法可以通过简单地将蒙版与图像以元素方式相乘来实现。假设您的输入被称为numpy并且您的二进制掩码被称为img,我假设掩码是2D,只需执行以下操作:

mask

上述代码虽然假设import numpy as np import cv2 mask = ... # define mask here img = cv2.imread(...) # Define input image here # Create new image new_image = img * (mask.astype(img.dtype)) img共享相同数量的频道。如果您使用彩色图像作为源和我已经假设的掩模2D,那将变得棘手。因此,通道总数为2而不是3,因此上述语法会给您一个错误,因为两者之间的尺寸不再兼容。使用彩色图像时,您需要适应这一点。您可以通过向蒙版添加单个第三维来实现此目的,以便可以利用广播。

mask

对于第二种方法,我们假设我们有另一个名为import numpy as np import cv2 mask = ... # define mask here img = cv2.imread(...) # Define input image here # Create new image # Case #1 - Other image is grayscale and source image is colour if len(img.shape) == 3 and len(mask.shape) != 3: new_image = img * (mask[:,:,None].astype(img.dtype)) # Case #2 - Both images are colour or grayscale elif (len(img.shape) == 3 and len(mask.shape) == 3) or \ (len(img.shape) == 1 and len(mask.shape) == 1): new_image = img * (mask.astype(img.dtype)) # Otherwise, we can't do this else: raise Exception("Incompatible input and mask dimensions") 的图像,您希望将屏幕定义的此图像中的内容复制回目标图像other_image。在这种情况下,首先要做的是使用numpy.where确定掩码中非零的所有位置,然后使用这些位置索引或切片到图像以及要从中复制的位置。我们还必须注意两个图像之间的通道数量,就像第一种方法一样:

img

这是两种方法的示例运行。我将使用Cameraman图像,这是大多数图像处理算法中看到的标准测试图像。

enter image description here

我还人工制作了图像颜色,即使它可视化为灰度,但强度将被复制到所有通道。我还将定义一个掩码,它只是左上角的1​​00 x 100子区域,因此我们将创建一个仅复制此子区域的输出图像:

import numpy as np
import cv2

mask = ... # define mask here
img = cv2.imread(...) # Define input image here
other_image = cv2.imread(...) # Define other image here

locs = np.where(mask != 0) # Get the non-zero mask locations

# Case #1 - Other image is grayscale and source image is colour
if len(img.shape) == 3 and len(other_image.shape) != 3:
    img[locs[0], locs[1]] = other_image[locs[0], locs[1], None]
# Case #2 - Both images are colour or grayscale
elif (len(img.shape) == 3 and len(other_image.shape) == 3) or \
   (len(img.shape) == 1 and len(other_image.shape) == 1):
    img[locs[0], locs[1]] = other_image[locs[0], locs[1]]
# Otherwise, we can't do this
else:
    raise Exception("Incompatible input and output dimensions")

当您使用第一种方法时,当我们显示结果时,我们得到:

enter image description here

我们可以看到我们创建了一个输出图像,其中左上角100 x 100子区域包含我们的图像数据,其余像素设置为0.这取决于设置为{{1}的掩码位置}。对于第二种方法,我们将创建另一个图像,该图像是与所有通道的import numpy as np import cv2 # Define image img = cv2.imread("cameraman.png") # Define mask mask = np.zeros(img.shape, dtype=np.bool) mask[:100, :100] = True 跨越的输入图像大小相同的随机图像。

True

一旦我们使用第二种方法运行代码,我现在就得到这个图像:

enter image description here

如您所见,图像的左上角已根据设置为[0, 255]的蒙版位置进行更新。

答案 1 :(得分:4)

请注意,如果这正是您想要的,但是在Python中使用蒙版进行复制时,我会选择cv2.bitwise_

new_image = cv2.bitwise_and(old_image,binary_mask)