numpy最大窗口

时间:2013-09-05 20:08:42

标签: python numpy

我有一个数组,我想通过扫描2x2非重叠窗口并获得最大值来生成一个较小的数组。这是一个例子:

import numpy as np

np.random.seed(123)
np.set_printoptions(linewidth=1000,precision=3)
arr = np.random.uniform(-1,1,(4,4))
res = np.zeros((2,2))
for i in xrange(res.shape[0]):
    for j in xrange(res.shape[1]):
        ii = i*2
        jj = j*2
        res[i][j] = max(arr[ii][jj],arr[ii+1][jj],arr[ii][jj+1],arr[ii+1][jj+1])

print arr
print res

所以像这样的矩阵:

[[ 0.393 -0.428 -0.546  0.103]
 [ 0.439 -0.154  0.962  0.37 ]
 [-0.038 -0.216 -0.314  0.458]
 [-0.123 -0.881 -0.204  0.476]]

应该成为这个:

[[ 0.439  0.962]
 [-0.038  0.476]]    

如何更有效地完成这项工作?

2 个答案:

答案 0 :(得分:9)

你可以这样做:

print arr.reshape(2,2,2,2).swapaxes(1,2).reshape(2,2,4).max(axis=-1)

[[ 0.439  0.962]
 [-0.038  0.476]]

从以下开始解释:

arr=np.array([[0.393,-0.428,-0.546,0.103],
[0.439,-0.154,0.962,0.37,],
[-0.038,-0.216,-0.314,0.458],
[-0.123,-0.881,-0.204,0.476]])

我们首先要将轴分组到相关部分。

tmp = arr.reshape(2,2,2,2).swapaxes(1,2)
print tmp    

[[[[ 0.393 -0.428]
   [ 0.439 -0.154]]

  [[-0.546  0.103]
   [ 0.962  0.37 ]]]


 [[[-0.038 -0.216]
   [-0.123 -0.881]]

  [[-0.314  0.458]
   [-0.204  0.476]]]]

再次重塑以获取我们想要的数据组:

tmp = tmp.reshape(2,2,4)
print tmp

[[[ 0.393 -0.428  0.439 -0.154]
  [-0.546  0.103  0.962  0.37 ]]

 [[-0.038 -0.216 -0.123 -0.881]
  [-0.314  0.458 -0.204  0.476]]]

最后沿最后一个轴取最大值。

对于方形矩阵,这可以推广为:

k = arr.shape[0]/2
arr.reshape(k,2,k,2).swapaxes(1,2).reshape(k,k,4).max(axis=-1)

根据Jamie和Dougal的评论,我们可以进一步概括:

n = 2                   #Height of window
m = 2                   #Width of window
k = arr.shape[0] / n    #Must divide evenly
l = arr.shape[1] / m    #Must divide evenly
arr.reshape(k,n,l,m).max(axis=(-1,-3))              #Numpy >= 1.7.1
arr.reshape(k,n,l,m).max(axis=-3).max(axis=-1)      #Numpy <  1.7.1

答案 1 :(得分:2)

正如我在评论区域中提到的,请考虑使用NumBa。您可以保持双循环,在装饰器中添加大约10个字符,并为此获得类似C的性能。如果您使用Continuum Analytics的“Anaconda”Python分发版,则易于使用。

这对于NumBa来说几乎是一个完美的用例,因为这个算法用双循环更自然地表达。重塑方法利用快速数组操作,但除非你已经知道程序的目标,否则它是非常难以理解的。非常希望将这样的函数保留为扩展形式,并通过让其他东西在事后转换为低级语言来实现速度。