我正在尝试使用OpenCV的 filter2D()
进行卷积。在我的算法中,我需要在将内核传递给函数之前将其翻转。我的第一次尝试是使用Numpy的fliplr()
和flipud()
方法:
def test_np():
im = np.random.uniform(size=(32, 32))
k = np.ones((3, 3), dtype=np.float32) / 9.
k = np.fliplr(np.flipud(k)) # Numpy-flipped kernel
return cv2.filter2D(im, -1, k)
令人惊讶的是,它在过滤期间给了我一个断言错误:
OpenCV错误:转置中的断言失败(src.dims< = 2&& esz< =(size_t)32),文件/build/buildd/opencv-2.4.2+dfsg/modules/core/ src / matrix.cpp,第1877行 在抛出'cv :: Exception'的实例后终止调用 what():/ build / buildd / opencv-2.4.2 + dfsg / modules / core / src / matrix.cpp:1877:error:( - 1515)src.dims< = 2&&函数转置中的esz< =(size_t)32
但是,如果我将翻转方法更改为OpenCV的flip()
:
def test_cv2():
im = np.random.uniform(size=(32, 32))
k = np.ones((3, 3), dtype=np.float32) / 9.
k = cv2.flip(k, -1) # OpenCV-flipped kernel
return cv2.filter2D(im, -1, k)
filter2D()
没有任何问题。
我检查了np.fliplr(np.flipud(...))
和cv2.flip(...)
的结果,它们是相同的:
k_np = np.fliplr(np.flipud(k))
k_cv2 = cv2.flip(k, -1)
(k_np == k_cv2).all() # gives True
所以我们有2个看起来相同但行为不同的数组。
我很好奇,与Numpy一起翻转的阵列与OpenCV翻转的阵列有什么区别?另外,我应该期待与其他功能类似的问题吗?
答案 0 :(得分:4)
我认为以下解释是导致这种不当行为的原因。
简短说明:
当您使用numpy函数进行翻转时,只更改ndarray的步幅,而不是整个数组,即它只是创建一个具有不同步幅的视图。但是当你使用OpenCV函数进行翻转时,整个数组将被重新整形。因此,当您应用filter2D()函数时,它会在内部调用transpose()。最初,OpenCV的Python包装器无法按照预期的方式执行具有负步幅的数组转换。
所以可能的解决方案是使用copy()
方法手动复制数组。
稍后,此解决方案已解决,因此您可以使用更高版本的opencv。 (我使用OpenCV 3.x,从OpenCV master分支编译,它工作正常)
详细说明:
首先要了解Numpy ndarray
的结构 Numpy数组修改其步幅以实现许多操作,如翻转,转置等。它具有很大的优势,无需复制数组,从而提高了性能。所以这些函数不会创建副本,而只是view
。这些创建的视图可能不是连续数组,但复制始终会创建连续数组。
但是OpenCV总是会创建数组的副本。所以在这些情况下,OpenCV函数可能比Numpy函数慢,因为numpy只编辑strides值,而不是数组。您可以使用以下转置功能进行如下检查:
In [39]: x = np.ones((3,3),dtype=np.float32)
In [40]: x.strides
Out[40]: (12, 4)
In [43]: x.flags
Out[43]:
C_CONTIGUOUS : True # Original array is continuous
F_CONTIGUOUS : False
OWNDATA : True
WRITEABLE : True
ALIGNED : True
UPDATEIFCOPY : False
现在尝试使用Numpy转置
In [41]: y = np.transpose(x)
In [42]: y.strides
Out[42]: (4, 12) # transpose just change the strides
In [44]: y.flags
Out[44]:
C_CONTIGUOUS : False # tranposed array is not continuous in numpy
F_CONTIGUOUS : True
OWNDATA : False
WRITEABLE : True
ALIGNED : True
UPDATEIFCOPY : False
现在尝试使用OpenCV转置
In [45]: z = cv2.transpose(x)
In [46]: np.all(z==y) # result of numpy and OpenCV are same
Out[46]: True
In [47]: z.strides # Check the strides
Out[47]: (12, 4)
In [48]: z.flags
Out[48]:
C_CONTIGUOUS : True # OpenCV result is continuous.
F_CONTIGUOUS : False
OWNDATA : True
WRITEABLE : True
ALIGNED : True
UPDATEIFCOPY : False
最后尝试使用numpy transpose手动复制
In [53]: q = np.transpose(x).copy()
In [55]: np.all(z==q)
Out[55]: True
In [56]: q.strides # Strides is same as OpenCV function
Out[56]: (12, 4)
In [57]: q.flags
Out[57]:
C_CONTIGUOUS : True # result is continuous also
F_CONTIGUOUS : False
OWNDATA : True
WRITEABLE : True
ALIGNED : True
UPDATEIFCOPY : False
和效果比较
In [49]: %timeit y = np.transpose(x)
1000000 loops, best of 3: 701 ns per loop
In [50]: %timeit y = np.transpose(x).copy()
1000000 loops, best of 3: 1.48 us per loop
In [51]: %timeit y = cv2.transpose(x)
1000000 loops, best of 3: 1.04 us per loop
同样,用numpy函数翻转会产生负面步幅。但OpenCV函数不会创建。
In [58]: a = np.fliplr(x)
In [59]: a.strides
Out[59]: (12, -4)
In [60]: b = cv2.flip(x,-1)
In [61]: b.strides
Out[61]: (12, 4)
在早期版本的OpenCV中,python包装器无法将负跨步数组转换为相应的Mat结构。所以可能的解决方案是使用copy()
方法使数组连续。
但是在更高版本的OpenCV中,他们添加了这种支持。它会检查步幅,如果它是负数,那么数组的副本将由python包装器完成。所以这不是OpenCV后期版本的问题。
我正在使用OpenCV 3,它是从OpenCV的主分支编译的。我们来检查一下:
In [62]: cv2.__version__
Out[62]: '3.0.0-dev'
In [63]: im = np.random.uniform(size=(32,32))
In [64]: k = np.ones((3,3), dtype=np.float32)/9.
In [65]: k = np.fliplr(np.flipud(k))
In [66]: z = cv2.filter2D(im, -1, k)
In [70]: print z[:5,:5]
[[ 0.65543429 0.53362787 0.45040413 0.52151458 0.61432061]
[ 0.53666124 0.49690944 0.40779054 0.50330829 0.60923295]
[ 0.39288601 0.42130001 0.41378173 0.5080897 0.58349994]
[ 0.32685086 0.4340541 0.46039198 0.48272091 0.45093509]
[ 0.25456175 0.40217766 0.4459138 0.49665956 0.4198618 ]]