我有两个图像,一个只有背景,另一个带背景+可检测物体(在我的例子中是一辆汽车)。以下是图片
我正在尝试删除背景,以便在结果图像中只有汽车。以下是我试图获得所需结果的代码
import numpy as np
import cv2
original_image = cv2.imread('IMG1.jpg', cv2.IMREAD_COLOR)
gray_original = cv2.cvtColor(original_image, cv2.COLOR_BGR2GRAY)
background_image = cv2.imread('IMG2.jpg', cv2.IMREAD_COLOR)
gray_background = cv2.cvtColor(background_image, cv2.COLOR_BGR2GRAY)
foreground = np.absolute(gray_original - gray_background)
foreground[foreground > 0] = 255
cv2.imshow('Original Image', foreground)
cv2.waitKey(0)
通过减去两个图像得到的图像是
这是问题所在。预期的结果图像应该只是一辆汽车。 此外,如果你深入研究两张图像,你会发现它们不完全相同,相机移动了一点,所以背景受到了一点干扰。我的问题是,使用这两个图像我怎样才能减去背景。我现在不想使用grabCut或backgroundSubtractorMOG算法,因为我现在还不知道这些算法里面有什么。
如果可能的话,请指导我这样做的一般方法,不仅在这个特定的情况下,我在一个图像中有背景,在第二个图像中有背景+对象。这可能是最好的方法。抱歉这么长的问题。
答案 0 :(得分:15)
我使用OpenCV的watershed算法解决了您的问题。你可以找到分水岭的理论和例子here。
首先,我选择了几个点(标记)来指示我想要保留的对象在哪里,以及背景在哪里。此步骤是手动的,并且可能因图像而异。此外,它需要一些重复,直到您得到所需的结果。我建议使用工具来获取像素坐标。 然后我创建了一个零的空整数数组,其中包含汽车图像的大小。然后我将一些值(1:背景,[255,192,128,64]:car_parts)分配给标记位置的像素。
注意:当我下载你的图片时,我不得不裁剪它以获得一辆车。裁剪后,图像大小为400x601。这可能不是您拥有的图像大小,因此标记将会关闭。
之后我使用了分水岭算法。第一个输入是您的图像,第二个输入是标记图像(除标记位置外,其他地方都为零)。结果如下图所示。
我将所有像素的值设置为大于1到255(汽车),其余(背景)设置为零。然后我用3x3内核扩张获得的图像,以避免丢失关于汽车轮廓的信息。最后,我使用扩展图像作为原始图像的掩码,使用cv2.bitwise_and()函数,结果如下图所示:
这是我的代码:
import cv2
import numpy as np
import matplotlib.pyplot as plt
# Load the image
img = cv2.imread("/path/to/image.png", 3)
# Create a blank image of zeros (same dimension as img)
# It should be grayscale (1 color channel)
marker = np.zeros_like(img[:,:,0]).astype(np.int32)
# This step is manual. The goal is to find the points
# which create the result we want. I suggest using a
# tool to get the pixel coordinates.
# Dictate the background and set the markers to 1
marker[204][95] = 1
marker[240][137] = 1
marker[245][444] = 1
marker[260][427] = 1
marker[257][378] = 1
marker[217][466] = 1
# Dictate the area of interest
# I used different values for each part of the car (for visibility)
marker[235][370] = 255 # car body
marker[135][294] = 64 # rooftop
marker[190][454] = 64 # rear light
marker[167][458] = 64 # rear wing
marker[205][103] = 128 # front bumper
# rear bumper
marker[225][456] = 128
marker[224][461] = 128
marker[216][461] = 128
# front wheel
marker[225][189] = 192
marker[240][147] = 192
# rear wheel
marker[258][409] = 192
marker[257][391] = 192
marker[254][421] = 192
# Now we have set the markers, we use the watershed
# algorithm to generate a marked image
marked = cv2.watershed(img, marker)
# Plot this one. If it does what we want, proceed;
# otherwise edit your markers and repeat
plt.imshow(marked, cmap='gray')
plt.show()
# Make the background black, and what we want to keep white
marked[marked == 1] = 0
marked[marked > 1] = 255
# Use a kernel to dilate the image, to not lose any detail on the outline
# I used a kernel of 3x3 pixels
kernel = np.ones((3,3),np.uint8)
dilation = cv2.dilate(marked.astype(np.float32), kernel, iterations = 1)
# Plot again to check whether the dilation is according to our needs
# If not, repeat by using a smaller/bigger kernel, or more/less iterations
plt.imshow(dilation, cmap='gray')
plt.show()
# Now apply the mask we created on the initial image
final_img = cv2.bitwise_and(img, img, mask=dilation.astype(np.uint8))
# cv2.imread reads the image as BGR, but matplotlib uses RGB
# BGR to RGB so we can plot the image with accurate colors
b, g, r = cv2.split(final_img)
final_img = cv2.merge([r, g, b])
# Plot the final result
plt.imshow(final_img)
plt.show()
如果你有很多图像,你可能需要创建一个工具来以图形方式注释标记,甚至是一种自动查找标记的算法。
答案 1 :(得分:5)
问题是你要减去无符号 8位整数的数组。此操作可能会溢出。
演示
>>> import numpy as np
>>> a = np.array([[10,10]],dtype=np.uint8)
>>> b = np.array([[11,11]],dtype=np.uint8)
>>> a - b
array([[255, 255]], dtype=uint8)
由于您使用的是OpenCV,因此实现目标的最简单方法是使用cv2.absdiff()
。
>>> cv2.absdiff(a,b)
array([[1, 1]], dtype=uint8)
答案 2 :(得分:0)
我建议使用OpenCV的抓取算法。首先,在前景和背景上绘制几条线,并继续执行此操作,直到前景与背景充分分离为止。它在这里介绍:https://docs.opencv.org/trunk/d8/d83/tutorial_py_grabcut.html 以及此视频中:https://www.youtube.com/watch?v=kAwxLTDDAwU