我有一个numpy数组。我想创建一个新数组,它是每个连续三元素的平均值。因此,新阵列将是原始阵列的三分之一。
举个例子:
np.array([1,2,3,1,2,3,1,2,3])
应该返回数组:
np.array([2,2,2])
有人能建议一种有效的方法吗?我正在画空白。
答案 0 :(得分:66)
如果数组arr
的长度可被3整除:
np.mean(arr.reshape(-1, 3), axis=1)
重新定位到更高维度的数组,然后在其中一个附加维度上执行某种形式的reduce操作是numpy编程的主要内容。
答案 1 :(得分:1)
对于正在寻找具有多个维度的数组的简单概括的Google员工:block_reduce
模块(link to docs)中的函数scikit-image
。
它具有一个非常简单的界面,可以通过应用诸如numpy.mean
之类的函数对数组进行下采样,但也可以使用其他函数(最大值,中位数,...)。通过为块提供具有不同大小的元组,可以针对不同的轴通过不同的因素进行下采样。这是一个二维数组的例子。使用均值仅将轴1下采样10:
import numpy as np
from skimage.measure import block_reduce
arr = np.stack((np.arange(1,20), np.arange(20,39)))
# array([[ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
# [20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38]])
arr_reduced = block_reduce(arr, block_size=(1,5), func=np.mean, cval=np.mean(arr))
# array([[ 3. , 8. , 13. , 17.8],
# [22. , 27. , 32. , 33. ]])
正如在对另一个答案的评论中所讨论的:如果无法将缩小维数的数组不能被块大小整除,则填充值由参数cval
(默认为0)提供。