numpy二维数组的块平均值

时间:2013-01-09 05:51:07

标签: python numpy matrix reshape mean

我想在NumPy中找到2D数组的块平均值。为简单起见,我们假设数组如下:

array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23]])

我想将这个数组分成3个大小为2x4的块,然后找到所有三个块的平均值(这样平均值的形状是2x4。第一个块是由前4列组成的,下一个是接下来的4列等等。所以我的块是:

array([[0, 1, 2, 3],
       [12, 13, 14, 15]])

array([[ 4,  5,  6,  7],
       [16, 17, 18, 19]])

array([[ 8,  9, 10, 11],
       [20, 21, 22, 23]])

我可以使用循环来执行此操作,但我觉得最好先通过reshape将此数组转换为3D数组,然后在3D数组上使用mean方法沿第三轴。这可能类似于this question

如果有人能提供给我,我将不胜感激:

1)。如果存在这样的技巧,那么执行块的适当Pythonic命令意味着甚至不转换为3D。

2)。如果没有合适的Pythonic命令进行2D到3D转换。

3)。了解使用循环或使用上述命令进行更高效(在空间方面)。

2 个答案:

答案 0 :(得分:4)

Numpy方法几乎总能击败python循环,所以我将跳过你的1。

对于2,在这种特殊情况下,以下工作:

a = np.array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11],
              [12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23]])
a = a.reshape(2, 3, 4)
>>> a
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])
>>> np.mean(a, axis=1)
array([[  4.,   5.,   6.,   7.],
       [ 16.,  17.,  18.,  19.]])

诀窍在于reshape。对于需要n列块的一般情况,以下是一个选项

a = a.reshape((a.shape[0], -1, n))

你对3的关注大多是没有根据的。 reshape返回原始数组的视图,而不是副本,因此转换为3D只需要更改数组的shapestrides属性,而无需复制任何实际数据

修改 为了确保重塑不复制数组,但返回视图,请重新整形为

a.shape = a = a.reshape((a.shape[0], -1, n))

docs中的示例如下:

>>> a = np.arange(12).reshape(3,4)
>>> b = a.T
>>> b.shape = (12,)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: incompatible shape for a non-contiguous array

一般情况下,如果您在阵列上执行transposerollaxisswapaxes等操作,则只会出现问题。

答案 1 :(得分:-1)

我可以回答你的电话号码1)。

vstack([mean(a[:,4*i:4*(i+1)],axis=1) for i in range(3)]).T