我有一个8x8矩阵如下:
[[ 0.3 0.3 0.3 0.3 0.3 0.5 0.1 -0.1]
[ 0.1 0.1 -0.1 0.3 0.3 -0.1 -0.1 -0.5]
[-0.1 0.1 0.3 -0.1 0.3 -0.1 -0.1 -0.1]
[-0.1 0.1 0.5 0.3 -0.3 -0.1 -0.3 -0.1]
[ 0.5 0.1 -0.1 0.1 -0.1 -0.1 -0.3 -0.5]
[ 0.1 -0.1 -0.3 -0.5 -0.5 -0.1 -0.1 -0.3]
[-0.5 -0.3 -0.3 -0.3 -0.1 -0.5 -0.1 -0.3]
[-0.3 -0.3 -0.3 -0.3 -0.1 -0.1 -0.5 -0.3]]
我的窗口是2x2。我想要做的是将四个数字(上下数字)组合在一起。示例输出如下所示:
[[0.3 0.3
0.1 0.1]
[0.3 0.3
-0.1 0.3]
.......
.......
[-0.1 -0.3
-0.5 -0.3]]
我使用的是print arr.reshape(16,2,2)
我无法理解的是如何为此要求设置轴。我的输出是:
[[[ 0.3 0.3]
[ 0.3 0.3]]
[[ 0.3 0.1]
[ 0.5 -0.1]]
[[ 0.1 -0.1]
[ 0.1 0.3]]
[[ 0.3 -0.1]
[-0.1 -0.5]]
[[-0.1 0.3]
[ 0.1 -0.1]]
[[ 0.3 -0.1]
[-0.1 -0.1]]
[[-0.1 0.5]
[ 0.1 0.3]]
[[-0.3 -0.3]
[-0.1 -0.1]]
[[ 0.5 -0.1]
[ 0.1 0.1]]
[[-0.1 -0.3]
[-0.1 -0.5]]
[[ 0.1 -0.3]
[-0.1 -0.5]]
[[-0.5 -0.1]
[-0.1 -0.3]]
[[-0.5 -0.3]
[-0.3 -0.3]]
[[-0.1 -0.1]
[-0.5 -0.3]]
[[-0.3 -0.3]
[-0.3 -0.3]]
[[-0.1 -0.5]
[-0.1 -0.3]]]
请解释如何在这种情况下应用轴。或者,如果他们是更好的方式来获得最大池,请提及。
注意:所有这些都是针对max-pooling的。我在python上使用NumPy,SciPy。
答案 0 :(得分:3)
确实
arr.reshape((4, 2, 4, 2)).transpose((0, 2, 1, 3)).reshape((16, 2, 2))
做你想做的事吗?
编辑:一点解释:第一次重塑将x和y轴分别切成4个2块。这几乎就是你要求的,只有块在轴1和3上,而不是在最后一个二。这就是转置的用武之地。它是数学中矩阵转置(将轴0和1交换)到任意维度的直接推广。参数(0,2,1,3)要求它保留第0和最后一个轴并交换轴1和2.
此时形状为(4,4,2,2)。因此最终的重塑使前两个轴变平。如果您可以使用4 x 4块2 x 2,那么实际上建议不要进行第二次重塑,因为与前两次操作相比,它的计算成本很高。
这是因为转置创建了一个非连续的数组。现在,连续和非连续数组之间的一个区别是重塑连续数组的成本几乎为零,而重塑非连续数组通常会强制复制。
答案 1 :(得分:1)
将两个轴中的每一个分别重新分成两个,使得分割轴的后者与块大小具有相同的长度。这会给我们一个4D
数组。然后,沿后面的轴执行最大查找,这将是4D
数组中的第二和第四轴。
因此,只需做 -
m,n = a.shape
out = a.reshape(m//2,2,n//2,2).max(axis=(1,3))
示例运行 -
In [50]: a
Out[50]:
array([[87, 96, 46, 97, 25, 22, 13, 16],
[65, 62, 68, 87, 52, 80, 26, 82],
[27, 82, 50, 20, 11, 14, 94, 23],
[86, 44, 17, 97, 17, 57, 76, 42],
[47, 85, 30, 61, 55, 87, 11, 35],
[36, 11, 29, 45, 16, 54, 40, 77],
[38, 87, 94, 77, 53, 20, 46, 18],
[86, 50, 17, 23, 91, 23, 25, 11]])
In [51]: m,n = a.shape
In [52]: a.reshape(m//2,2,n//2,2).max(axis=(1,3))
Out[52]:
array([[96, 97, 80, 82],
[86, 97, 57, 94],
[85, 61, 87, 77],
[87, 94, 91, 46]])