让我在这篇文章前言说我对Python和NumPy很新,所以我确定我忽略了一些简单的东西。我要做的是使用掩码(掩模卷积操作)在PGM(灰度)文件上进行图像处理;但是,我不想使用可用的SciPy一体化成像处理库 - 我试图自己实现屏蔽和处理操作。我想做的是以下几点:
这个过程有点像这样,除了我需要将卷积特征的结果放回到它所来自的窗口的中心: http://ufldl.stanford.edu/wiki/images/6/6c/Convolution_schematic.gif
因此,在上面的示例中,4
将返回到它所来自的3x3窗口的中心位置(在所有操作结束之后),因此它看起来像[[1, 1, 1], [0, 4, 1], [0, 0, 1]]
所以对于获得的每个其他卷积特征。也可以使用原始的非参考拷贝和插入该值的新值。
所以,这就是我到目前为止所做的:我有一个256x256 2D numpy数组,这是我的源图像。使用as_strided,
我将它转换为4x numpy 3x3切片数组。我面临的主要问题是我想执行我在每个切片上指定的操作。我能够在一个切片上执行它,但在我尝试过的npsum
个操作中,它将所有切片的结果加到一个值中。在此之后,我要么想要以我所描述的方式创建一个新的256x256数组,或者迭代原始数据,在适当时替换每个3x3窗口的中间值。我曾尝试使用ndenumerate
每次更改我的4D数组的相同值(v, x, 1, 1)
,但由于从我的4D数组返回的索引的格式为(v, x, y, z),
我不能似乎弄清楚如何只迭代(v, x)
并将最后两部分保留为不应该改变的常量。
到目前为止,这是我的代码:
import numpy as np
from numpy.lib import stride_tricks
# create 256x256 NumPy 2D array from image data and image size so we can manipulate the image data, then create a 4D array of strided windows
# currently, it's only creating taking 10 slices to test with
imageDataArray = np.array(parsedPGMFile.imageData, dtype=int).reshape(parsedPGMFile.numRows, parsedPGMFile.numColumns)
xx = stride_tricks.as_strided(imageDataArray, shape=(1, 10, 3, 3), strides=imageDataArray.strides + imageDataArray.strides)
# create the image mask to be used
mask = [1,2,1,2,4,2,1,2,1]
mask = np.array(mask, dtype=float).reshape(3, 3)/16
# this will execute the operation on just the first 3x3 element of xx, but need to figure out how to iterate through all elements and perform this operation individually on each element
result = np.sum(mask * xx[0,0])
来自http://wiki.scipy.org/Cookbook/GameOfLifeStrides,http://www.johnvinyard.com/blog/?p=268和http://chintaksheth.wordpress.com/2013/07/31/numpy-the-tricks-of-the-trade-part-ii/等来源的研究非常有用(以及SO),但它们似乎并没有解决我正在尝试做的事情确切地说(除非我遗漏了一些明显的东西)。我可能会使用大量的for
循环,但我宁愿学习如何使用我们拥有的这些非常棒的Python库。我也意识到我正在将几个问题结合在一起,但这只是因为我怀疑这一切都可以非常简单地完成!在此先感谢您的帮助!
答案 0 :(得分:3)
如果您需要按元素倍增,然后通过添加进行缩减,请考虑np.dot
或np.einsum
:
from numpy.lib.stride_tricks import as_strided
arr = np.random.rand(256, 256)
mask = np.random.rand(3, 3)
arr_view = as_strided(arr, shape=(254, 254, 3, 3), strides=arr.strides*2)
arr[1:-1, 1:-1] = np.einsum('ijkl,kl->ij', arr_view, mask)
答案 1 :(得分:1)
基于示例说明:
In [1]: import numpy as np
In [2]: from scipy.signal import convolve2d
In [3]: image = np.array([[1,1,1,0,0],[0,1,1,1,0],[0,0,1,1,1],[0,0,1,1,0],[0,1,1,0,0]])
In [4]: m = np.array([[1,0,1],[0,1,0],[1,0,1]])
In [5]: convolve2d(image, m, mode='valid')
Out[5]:
array([[4, 3, 4],
[2, 4, 3],
[2, 3, 4]])
把它放回原处:
In [6]: image[1:-1,1:-1] = convolve2d(image, m, mode='valid')
In [7]: image
Out[7]:
array([[1, 1, 1, 0, 0],
[0, 4, 3, 4, 0],
[0, 2, 4, 3, 1],
[0, 2, 3, 4, 0],
[0, 1, 1, 0, 0]])