在不使用重塑的情况下重塑n维数组的视图

时间:2016-03-04 18:58:18

标签: python numpy scikit-image

tl; dr 我可以在不使用numpy.reshape的情况下将5x5x5x3x3x3的numpy数组视图重塑为125x1x1x3x3x3吗?

我想对卷(MxMxM的大小)执行滑动窗口操作(具有不同的步幅)。可以使用numpy.lib.stride_tricks.as_strided生成滑动窗口数组,如BenjaminEickenberg之前所建议的那样,并在下面的代码段中演示,该代码段使用helper method from skimage使用as_strided

这个辅助方法的输出给我一个NxNxNxnxnxn的形状,但我更喜欢这个形状是N ^ 3x1xnxnxn。虽然我可以使用np.reshape来实现这一点,但是如果音量变大(> 100x100x100),np.reshape会很慢,我不知道为什么。我以为我可以使用as_stride来重塑输出,但是numpy崩溃(下面的代码片段)。关于如何在不使用np.reshape的情况下将助手方法的输出视为N ** 3x1xnxnxn的任何想法?

import numpy as np
import skimage
l = 15
s = 3
X = np.ones((l,l,l))      
print('actual shape',X.shape)
view = skimage.util.shape.view_as_blocks(X,(s,s,s))    
print('original view',view.shape)

new_shape = ((l/s)**3,1,1,s,s,s)
print('new view',new_shape)    

view_correct = view.reshape(new_shape)
print(view_correct.shape)
print('coord:','124,0,0,2,2,2','value:',view_correct[124,0,0,2,2,2])

view_incorrect = np.lib.stride_tricks.as_strided(view, shape=new_shape)
print(view_incorrect.shape)
print('coord:','124,0,0,2,2,2','value:',view_incorrect[124,0,0,2,2,2])

1 个答案:

答案 0 :(得分:1)

我从view_as_blocks中抽取了一个例子,尝试了重塑的风格:

A = np.arange(4*4).reshape(4,4)
B = view_as_blocks(A, block_shape=(2, 2))
print(A.__array_interface__)
print(B.__array_interface__)

C = B.reshape((2*2,2,2))
print(C.__array_interface__)
制造

{'typestr': '<i4', 'data': (153226600, False), 'shape': (4, 4),
 'descr': [('', '<i4')], 'version': 3, 'strides': None}
{'typestr': '<i4', 'data': (153226600, False), 'shape': (2, 2, 2, 2),
 'descr': [('', '<i4')], 'version': 3, 'strides': (32, 8, 16, 4)}
{'typestr': '<i4', 'data': (150895960, False), 'shape': (4, 2, 2),
 'descr': [('', '<i4')], 'version': 3, 'strides': None}

dataA的{​​{1}}指针是相同的; BB的视图。

但是A的指针是不同的。这是一份副本。这就解释了为什么你需要这么长时间。

让我们这样做有点不同:

C
制造

A = np.arange(4*4).reshape(4,4)
B = view_as_blocks(A, block_shape=(2, 2))
print(A.__array_interface__)
print(B.__array_interface__)

C = B.reshape((2*2,1,2,2))
print(C.__array_interface__)

D = as_strided(B, shape=(2*2,1,2,2))
print(D.__array_interface__)

print(B[1,1,:,:])
print(C[3,0,:,:])
print(D[3,0,:,:])

再次重塑会创建一个副本。第二个1254:~/mypy$ python3 skshape.py {'strides': None, 'typestr': '<i4', 'version': 3, 'data': (154278744, False), 'shape': (4, 4), 'descr': [('', '<i4')]} {'strides': (32, 8, 16, 4), 'typestr': '<i4', 'version': 3, 'data': (154278744, False), 'shape': (2, 2, 2, 2), 'descr': [('', '<i4')]} {'strides': None, 'typestr': '<i4', 'version': 3, 'data': (155705400, False), 'shape': (4, 1, 2, 2), 'descr': [('', '<i4')]} {'strides': (32, 8, 16, 4), 'typestr': '<i4', 'version': 3, 'data': (154278744, False), 'shape': (4, 1, 2, 2), 'descr': [('', '<i4')]} [[10 11] [14 15]] [[10 11] [14 15]] [[ 154561960 -1217783696] [ 48 3905]] 返回一个视图,但是大步走了。它正在寻找原始数据缓冲区之外的内存(这就是为什么自己玩大步是危险的一部分。)

在我的示例中,查看每个块的第一个角落值

as_strides

对于print(B[:,:,0,0]) print(C[:,0,0,0]) [[ 0 2] [ 8 10]] [ 0 2 8 10] ,行增加8,列增加2;这反映在B(4 * 8,4 * 2)跨越。

但是在(32,8)中,步骤是(2,6,2) - 跨步不能做到这一点。

由此我得出结论,没有副本就不可能重塑。