我有一个4-D numpy数组,第一个维度表示数据集中的图像数量,第二个和第三个维度表示(相等)宽度和高度,第四个维度表示通道数(3) 。例如,假设我有4张28 * 28的彩色图像,所以我的图像数据如下所示:
X = np.reshape(np.arange(4*28*28*3), (4,28,28,3))
我想为4张图像中的每张图像随机选择16 * 16宽x高的裁剪。至关重要的是,我希望每个图像的裁切是不同的,即我想生成4个随机(x_offset,y_offset)对。最后,我要访问形状数组(4、16、16、3)。
如果要在for循环中编写此代码,它将类似于以下内容:
x = np.random.randint(0,12,4)
y = np.random.randint(0,12,4)
for i in range(X.shape[0]):
cropped_image = X[i, x[i]:x[i]+16, y[i]:y[i]+16, :]
#Add cropped image to a list or something
但是我想尽可能高效地做到这一点,并且我想知道是否有一种方法可以大步向前和花哨的建立索引。我已经看到了this问题的答案,但是无法完全理解如何将stride_tricks之类的东西与第二和第三(宽度和高度)轴上的步幅的随机起点结合起来。 / p>
答案 0 :(得分:4)
strided-based
方法高效地提取补丁我们可以利用基于np.lib.stride_tricks.as_strided
的scikit-image's view_as_windows
来获得滑动窗口,这些窗口仅views
到输入数组中,因此不会产生额外的内存开销,并且实际上是免费的!我们当然可以直接使用np.lib.stride_tricks.as_strided
,但是所需的设置工作很难管理,尤其是在具有较大维数的阵列上。如果scikit-image
不可用,我们可以直接使用独立运行的source code
。
view_as_windows
的使用说明
使用view_as_windows
的想法是,我们以长度为元组的形式输入输入arg window_shape
,该元组的长度与需要滑动窗口的输入数组的维数相同。我们需要沿着其滑动的轴分别带有各自的窗口长度,而其余的轴则带有1s
。这将创建具有views
的{{1}}数组,即具有singleton dims/axes
的轴与lengths=1
arg中的1s
对应。因此,对于这些情况,我们可能希望索引到与window_shape
作为滑动窗口长度馈给的轴相对应的第零个元素,以具有滑动窗口的压缩版本。>
因此,我们将有一个解决方案-
1