我有一个数组,我想通过扫描2x2非重叠窗口并获得最大值来生成一个较小的数组。这是一个例子:
import numpy as np
np.random.seed(123)
np.set_printoptions(linewidth=1000,precision=3)
arr = np.random.uniform(-1,1,(4,4))
res = np.zeros((2,2))
for i in xrange(res.shape[0]):
for j in xrange(res.shape[1]):
ii = i*2
jj = j*2
res[i][j] = max(arr[ii][jj],arr[ii+1][jj],arr[ii][jj+1],arr[ii+1][jj+1])
print arr
print res
所以像这样的矩阵:
[[ 0.393 -0.428 -0.546 0.103]
[ 0.439 -0.154 0.962 0.37 ]
[-0.038 -0.216 -0.314 0.458]
[-0.123 -0.881 -0.204 0.476]]
应该成为这个:
[[ 0.439 0.962]
[-0.038 0.476]]
如何更有效地完成这项工作?
答案 0 :(得分:9)
你可以这样做:
print arr.reshape(2,2,2,2).swapaxes(1,2).reshape(2,2,4).max(axis=-1)
[[ 0.439 0.962]
[-0.038 0.476]]
从以下开始解释:
arr=np.array([[0.393,-0.428,-0.546,0.103],
[0.439,-0.154,0.962,0.37,],
[-0.038,-0.216,-0.314,0.458],
[-0.123,-0.881,-0.204,0.476]])
我们首先要将轴分组到相关部分。
tmp = arr.reshape(2,2,2,2).swapaxes(1,2)
print tmp
[[[[ 0.393 -0.428]
[ 0.439 -0.154]]
[[-0.546 0.103]
[ 0.962 0.37 ]]]
[[[-0.038 -0.216]
[-0.123 -0.881]]
[[-0.314 0.458]
[-0.204 0.476]]]]
再次重塑以获取我们想要的数据组:
tmp = tmp.reshape(2,2,4)
print tmp
[[[ 0.393 -0.428 0.439 -0.154]
[-0.546 0.103 0.962 0.37 ]]
[[-0.038 -0.216 -0.123 -0.881]
[-0.314 0.458 -0.204 0.476]]]
最后沿最后一个轴取最大值。
对于方形矩阵,这可以推广为:
k = arr.shape[0]/2
arr.reshape(k,2,k,2).swapaxes(1,2).reshape(k,k,4).max(axis=-1)
根据Jamie和Dougal的评论,我们可以进一步概括:
n = 2 #Height of window
m = 2 #Width of window
k = arr.shape[0] / n #Must divide evenly
l = arr.shape[1] / m #Must divide evenly
arr.reshape(k,n,l,m).max(axis=(-1,-3)) #Numpy >= 1.7.1
arr.reshape(k,n,l,m).max(axis=-3).max(axis=-1) #Numpy < 1.7.1
答案 1 :(得分:2)
正如我在评论区域中提到的,请考虑使用NumBa。您可以保持双循环,在装饰器中添加大约10个字符,并为此获得类似C的性能。如果您使用Continuum Analytics的“Anaconda”Python分发版,则易于使用。
这对于NumBa来说几乎是一个完美的用例,因为这个算法用双循环更自然地表达。重塑方法利用快速数组操作,但除非你已经知道程序的目标,否则它是非常难以理解的。非常希望将这样的函数保留为扩展形式,并通过让其他东西在事后转换为低级语言来实现速度。