我想在NumPy中找到2D数组的块平均值。为简单起见,我们假设数组如下:
array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11],
[12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23]])
我想将这个数组分成3个大小为2x4的块,然后找到所有三个块的平均值(这样平均值的形状是2x4。第一个块是由前4列组成的,下一个是接下来的4列等等。所以我的块是:
array([[0, 1, 2, 3],
[12, 13, 14, 15]])
array([[ 4, 5, 6, 7],
[16, 17, 18, 19]])
array([[ 8, 9, 10, 11],
[20, 21, 22, 23]])
我可以使用循环来执行此操作,但我觉得最好先通过reshape
将此数组转换为3D数组,然后在3D数组上使用mean
方法沿第三轴。这可能类似于this question。
如果有人能提供给我,我将不胜感激:
1)。如果存在这样的技巧,那么执行块的适当Pythonic命令意味着甚至不转换为3D。
2)。如果没有合适的Pythonic命令进行2D到3D转换。
3)。了解使用循环或使用上述命令进行更高效(在空间方面)。
答案 0 :(得分:4)
Numpy方法几乎总能击败python循环,所以我将跳过你的1。
对于2,在这种特殊情况下,以下工作:
a = np.array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11],
[12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23]])
a = a.reshape(2, 3, 4)
>>> a
array([[[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]],
[[12, 13, 14, 15],
[16, 17, 18, 19],
[20, 21, 22, 23]]])
>>> np.mean(a, axis=1)
array([[ 4., 5., 6., 7.],
[ 16., 17., 18., 19.]])
诀窍在于reshape
。对于需要n
列块的一般情况,以下是一个选项
a = a.reshape((a.shape[0], -1, n))
你对3的关注大多是没有根据的。 reshape
返回原始数组的视图,而不是副本,因此转换为3D只需要更改数组的shape
和strides
属性,而无需复制任何实际数据
修改强> 为了确保重塑不复制数组,但返回视图,请重新整形为
a.shape = a = a.reshape((a.shape[0], -1, n))
docs中的示例如下:
>>> a = np.arange(12).reshape(3,4)
>>> b = a.T
>>> b.shape = (12,)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: incompatible shape for a non-contiguous array
一般情况下,如果您在阵列上执行transpose
,rollaxis
,swapaxes
等操作,则只会出现问题。
答案 1 :(得分:-1)
我可以回答你的电话号码1)。
vstack([mean(a[:,4*i:4*(i+1)],axis=1) for i in range(3)]).T