从NumPy Array中提取块或补丁

时间:2015-07-20 23:04:15

标签: numpy scipy scikit-learn scikit-image

我有一个2-d numpy数组如下:

a = np.array([[1,5,9,13],
              [2,6,10,14],
              [3,7,11,15],
              [4,8,12,16]]

我想将其提取为2个2个大小的补丁,而不重复这些元素。

答案应完全相同。这可以是三维数组或列表,其元素顺序如下:

[[[1,5],
 [2,6]],   

 [[3,7],
 [4,8]],

 [[9,13],
 [10,14]],

 [[11,15],
 [12,16]]]

怎么能轻易做到?

在我真正的问题中,a的大小是(36,72)。我不能一个接一个地做。我想要以编程方式实现它。

3 个答案:

答案 0 :(得分:12)

使用scikit-image:

import numpy as np
from skimage.util import view_as_blocks

a = np.array([[1,5,9,13],
              [2,6,10,14],
              [3,7,11,15],
              [4,8,12,16]])

print(view_as_blocks(a, (2, 2)))

答案 1 :(得分:4)

您可以使用np.reshapenp.swapaxes的组合来实现它 -

def extract_blocks(a, blocksize):
    M,N = a.shape
    b0, b1 = blocksize
    return a.reshape(M//b0,b0,N//b1,b1).swapaxes(1,2).reshape(-1,b0,b1)

示例案例

让我们使用样本输入数组,如下所示 -

In [94]: a
Out[94]: 
array([[2, 2, 6, 1, 3, 6],
       [1, 0, 1, 0, 0, 3],
       [4, 0, 0, 4, 1, 7],
       [3, 2, 4, 7, 2, 4],
       [8, 0, 7, 3, 4, 6],
       [1, 5, 6, 2, 1, 8]])

现在,让我们使用一些块大小进行测试。让我们使用(2,3)(3,3)的块大小的两个案例。

案例#1:

In [95]: extract_blocks(a, (2,3)) # Blocksize : (2,3)
Out[95]: 
array([[[2, 2, 6],
        [1, 0, 1]],

       [[1, 3, 6],
        [0, 0, 3]],

       [[4, 0, 0],
        [3, 2, 4]],

       [[4, 1, 7],
        [7, 2, 4]],

       [[8, 0, 7],
        [1, 5, 6]],

       [[3, 4, 6],
        [2, 1, 8]]])

案例#2:

In [96]: extract_blocks(a, (3,3)) # Blocksize : (3,3)
Out[96]: 
array([[[2, 2, 6],
        [1, 0, 1],
        [4, 0, 0]],

       [[1, 3, 6],
        [0, 0, 3],
        [4, 1, 7]],

       [[3, 2, 4],
        [8, 0, 7],
        [1, 5, 6]],

       [[7, 2, 4],
        [3, 4, 6],
        [2, 1, 8]]])

答案 2 :(得分:3)

这是一个相当神秘的numpy单行程序来生成你的三维数组,在这里称为result1

In [60]: x
Out[60]: 
array([[2, 1, 2, 2, 0, 2, 2, 1, 3, 2],
       [3, 1, 2, 1, 0, 1, 2, 3, 1, 0],
       [2, 0, 3, 1, 3, 2, 1, 0, 0, 0],
       [0, 1, 3, 3, 2, 0, 3, 2, 0, 3],
       [0, 1, 0, 3, 1, 3, 0, 0, 0, 2],
       [1, 1, 2, 2, 3, 2, 1, 0, 0, 3],
       [2, 1, 0, 3, 2, 2, 2, 2, 1, 2],
       [0, 3, 3, 3, 1, 0, 2, 0, 2, 1]])

In [61]: result1 = x.reshape(x.shape[0]//2, 2, x.shape[1]//2, 2).swapaxes(1, 2).reshape(-1, 2, 2)

result1就像二维数组的一维数组:

In [68]: result1.shape
Out[68]: (20, 2, 2)

In [69]: result1[0]
Out[69]: 
array([[2, 1],
       [3, 1]])

In [70]: result1[1]
Out[70]: 
array([[2, 2],
       [2, 1]])

In [71]: result1[5]
Out[71]: 
array([[2, 0],
       [0, 1]])

In [72]: result1[-1]
Out[72]: 
array([[1, 2],
       [2, 1]])

(对不起,我现在没有时间详细说明它是如何运作的。也许以后......)

这是一个使用嵌套列表理解的不太神秘的版本。在这种情况下,result2是2-d numpy数组的python列表:

In [73]: result2 = [x[2*j:2*j+2, 2*k:2*k+2] for j in range(x.shape[0]//2) for k in range(x.shape[1]//2)]

In [74]: result2[5]
Out[74]: 
array([[2, 0],
       [0, 1]])

In [75]: result2[-1]
Out[75]: 
array([[1, 2],
       [2, 1]])