NumPy数组已重新整形,但如何更改用于合并的轴?

时间:2017-01-23 19:02:00

标签: python arrays numpy reshape max-pooling

我有一个8x8矩阵如下:

[[ 0.3  0.3  0.3  0.3  0.3  0.5  0.1 -0.1]
 [ 0.1  0.1 -0.1  0.3  0.3 -0.1 -0.1 -0.5]
 [-0.1  0.1  0.3 -0.1  0.3 -0.1 -0.1 -0.1]
 [-0.1  0.1  0.5  0.3 -0.3 -0.1 -0.3 -0.1]
 [ 0.5  0.1 -0.1  0.1 -0.1 -0.1 -0.3 -0.5]
 [ 0.1 -0.1 -0.3 -0.5 -0.5 -0.1 -0.1 -0.3]
 [-0.5 -0.3 -0.3 -0.3 -0.1 -0.5 -0.1 -0.3]
 [-0.3 -0.3 -0.3 -0.3 -0.1 -0.1 -0.5 -0.3]]

我的窗口是2x2。我想要做的是将四个数字(上下数字)组合在一起。示例输出如下所示:

    [[0.3 0.3
      0.1 0.1]

      [0.3 0.3
      -0.1 0.3]
       .......
       .......
      [-0.1 -0.3
       -0.5 -0.3]]

我使用的是print arr.reshape(16,2,2)我无法理解的是如何为此要求设置轴。我的输出是:

[[[ 0.3  0.3]
  [ 0.3  0.3]]

 [[ 0.3  0.1]
  [ 0.5 -0.1]]

 [[ 0.1 -0.1]
  [ 0.1  0.3]]

 [[ 0.3 -0.1]
  [-0.1 -0.5]]

 [[-0.1  0.3]
  [ 0.1 -0.1]]

 [[ 0.3 -0.1]
  [-0.1 -0.1]]

 [[-0.1  0.5]
  [ 0.1  0.3]]

 [[-0.3 -0.3]
  [-0.1 -0.1]]

 [[ 0.5 -0.1]
  [ 0.1  0.1]]

 [[-0.1 -0.3]
  [-0.1 -0.5]]

 [[ 0.1 -0.3]
  [-0.1 -0.5]]

 [[-0.5 -0.1]
  [-0.1 -0.3]]

 [[-0.5 -0.3]
  [-0.3 -0.3]]

 [[-0.1 -0.1]
  [-0.5 -0.3]]

 [[-0.3 -0.3]
  [-0.3 -0.3]]

 [[-0.1 -0.5]
  [-0.1 -0.3]]]

请解释如何在这种情况下应用轴。或者,如果他们是更好的方式来获得最大池,请提及。

注意:所有这些都是针对max-pooling的。我在python上使用NumPy,SciPy。

2 个答案:

答案 0 :(得分:3)

确实

arr.reshape((4, 2, 4, 2)).transpose((0, 2, 1, 3)).reshape((16, 2, 2))

做你想做的事吗?

编辑:一点解释:第一次重塑将x和y轴分别切成4个2块。这几乎就是你要求的,只有块在轴1和3上,而不是在最后一个二。这就是转置的用武之地。它是数学中矩阵转置(将轴0和1交换)到任意维度的直接推广。参数(0,2,1,3)要求它保留第0和最后一个轴并交换轴1和2.

此时形状为(4,4,2,2)。因此最终的重塑使前两个轴变平。如果您可以使用4 x 4块2 x 2,那么实际上建议不要进行第二次重塑,因为与前两次操作相比,它的计算成本很高。

这是因为转置创建了一个非连续的数组。现在,连续和非连续数组之间的一个区别是重塑连续数组的成本几乎为零,而重塑非连续数组通常会强制复制。

答案 1 :(得分:1)

将两个轴中的每一个分别重新分成两个,使得分割轴的后者与块大小具有相同的长度。这会给我们一个4D数组。然后,沿后面的轴执行最大查找,这将是4D数组中的第二和第四轴。

因此,只需做 -

m,n = a.shape
out = a.reshape(m//2,2,n//2,2).max(axis=(1,3))

示例运行 -

In [50]: a
Out[50]: 
array([[87, 96, 46, 97, 25, 22, 13, 16],
       [65, 62, 68, 87, 52, 80, 26, 82],
       [27, 82, 50, 20, 11, 14, 94, 23],
       [86, 44, 17, 97, 17, 57, 76, 42],
       [47, 85, 30, 61, 55, 87, 11, 35],
       [36, 11, 29, 45, 16, 54, 40, 77],
       [38, 87, 94, 77, 53, 20, 46, 18],
       [86, 50, 17, 23, 91, 23, 25, 11]])

In [51]: m,n = a.shape

In [52]: a.reshape(m//2,2,n//2,2).max(axis=(1,3))
Out[52]: 
array([[96, 97, 80, 82],
       [86, 97, 57, 94],
       [85, 61, 87, 77],
       [87, 94, 91, 46]])