有效地使用多个块状切片进行随机图像裁剪

时间:2018-08-17 01:37:13

标签: python numpy image-processing

我有一个4-D numpy数组,第一个维度表示数据集中的图像数量,第二个和第三个维度表示(相等)宽度和高度,第四个维度表示通道数(3) 。例如,假设我有4张28 * 28的彩色图像,所以我的图像数据如下所示:

X = np.reshape(np.arange(4*28*28*3), (4,28,28,3))

我想为4张图像中的每张图像随机选择16 * 16宽x高的裁剪。至关重要的是,我希望每个图像的裁切是不同的,即我想生成4个随机(x_offset,y_offset)对。最后,我要访问形状数组(4、16、16、3)。

如果要在for循环中编写此代码,它将类似于以下内容:

x = np.random.randint(0,12,4)
y = np.random.randint(0,12,4)
for i in range(X.shape[0]):
    cropped_image = X[i, x[i]:x[i]+16, y[i]:y[i]+16, :]
    #Add cropped image to a list or something

但是我想尽可能高效地做到这一点,并且我想知道是否有一种方法可以大步向前和花哨的建立索引。我已经看到了this问题的答案,但是无法完全理解如何将stride_tricks之类的东西与第二和第三(宽度和高度)轴上的步幅的随机起点结合起来。 / p>

1 个答案:

答案 0 :(得分:4)

利用strided-based方法高效地提取补丁

我们可以利用基于np.lib.stride_tricks.as_stridedscikit-image's view_as_windows来获得滑动窗口,这些窗口仅views到输入数组中,因此不会产生额外的内存开销,并且实际上是免费的!我们当然可以直接使用np.lib.stride_tricks.as_strided,但是所需的设置工作很难管理,尤其是在具有较大维数的阵列上。如果scikit-image不可用,我们可以直接使用独立运行的source code

view_as_windows的使用说明

使用view_as_windows的想法是,我们以长度为元组的形式输入输入arg window_shape,该元组的长度与需要滑动窗口的输入数组的维数相同。我们需要沿着其滑动的轴分别带有各自的窗口长度,而其余的轴则带有1s。这将创建具有views的{​​{1}}数组,即具有singleton dims/axes的轴与lengths=1 arg中的1s对应。因此,对于这些情况,我们可能希望索引到与window_shape作为滑动窗口长度馈给的轴相对应的第零个元素,以具有滑动窗口的压缩版本。

因此,我们将有一个解决方案-

1