我有一个2d numpy数组(6 x 6)元素。我想从中创建另一个2D数组,其中每个块是块大小窗口中所有元素的平均值。目前,我有foll。代码:
import os, numpy
def avg_func(data, blocksize = 2):
# Takes data, and averages all positive (only numerical) numbers in blocks
dimensions = data.shape
height = int(numpy.floor(dimensions[0]/blocksize))
width = int(numpy.floor(dimensions[1]/blocksize))
averaged = numpy.zeros((height, width))
for i in range(0, height):
print i*1.0/height
for j in range(0, width):
block = data[i*blocksize:(i+1)*blocksize,j*blocksize:(j+1)*blocksize]
if block.any():
averaged[i][j] = numpy.average(block[block>0])
return averaged
arr = numpy.random.random((6,6))
avgd = avg_func(arr, 3)
有什么方法可以让它更加pythonic? numpy有可能已经有了它吗?
更新
根据下面的M. Massias's soln,这里是一个更新,其中固定值被变量替换。不确定它是否编码正确。它似乎确实有效:
dimensions = data.shape
height = int(numpy.floor(dimensions[0]/block_size))
width = int(numpy.floor(dimensions[1]/block_size))
t = data.reshape([height, block_size, width, block_size])
avrgd = numpy.mean(t, axis=(1, 3))
答案 0 :(得分:2)
要在numpy中逐片计算某些操作,重新整形数组并使用额外的轴通常很有用。
要解释我们在这里使用的过程:你可以重塑阵列,取平均值,再次重塑它并再次取平均值。 这里我假设blocksize是2
t = np.array([[0, 1, 2, 3, 4, 5], [0, 1, 2, 3, 4, 5],[0, 1, 2, 3, 4, 5],[0, 1, 2, 3, 4, 5],[0, 1, 2, 3, 4, 5],[0, 1, 2, 3, 4, 5],])
t = t.reshape([6, 3, 2])
t = np.mean(t, axis=2)
t = t.reshape([3, 2, 3])
np.mean(t, axis=1)
输出
array([[ 0.5, 2.5, 4.5],
[ 0.5, 2.5, 4.5],
[ 0.5, 2.5, 4.5]])
现在很清楚它是如何工作的,你只能在一遍中完成:
t = t.reshape([3, 2, 3, 2])
np.mean(t, axis=(1, 3))
也有效(并且应该更快,因为手段只计算一次 - 我猜)。我会让您相应地替换height/blocksize
,width/blocksize
和blocksize
。
请参阅@askewcan关于如何将其概括为任何维度的好评。