找到2-D numpy数组的相对最大值

时间:2015-03-08 17:47:49

标签: python arrays numpy

我有一个2-D numpy数组,可以细分为64个盒子(想象棋盘)。 目标是返回每个框中最大值的位置和值的函数。类似的东西:

FindRefs(array) --> [(argmaxX00, argmaxY00, Max00), ...,(argmaxX63, argmaxY63, Max63)]

其中 argmaxXnn argmaxYnn 是整个数组(不是框)的索引, Maxnn 是每个数组的最大值框。换句话说,

Maxnn = array[argmaxYnn,argmaxYnn]

我尝试了明显的“嵌套式”解决方案:

def FindRefs(array):
    Height, Width = array.shape
    plumx = []
    plumy = []
    lum = []
    w = int(Width/8)
    h = int(Height/8)
    for n in range(0,8):    # recorrer boxes
        x0 = n*w
        x1 = (n+1)*w
        for m in range(0,8):
            y0 = m*h
            y1 = (m+1)*h
            subflatind = a[y0:y1,x0:x1].argmax() # flatten index of box
            y, x = np.unravel_index(subflatind, (h, w))
            X = x0 + x
            Y = y0 + y
            lum.append(a[Y,X])
            plumx.append(X)
            plumy.append(Y)

    refs = []
    for pt in range(0,len(plumx)):
        ptx = plumx[pt]
        pty = plumy[pt]
        refs.append((ptx,pty,lum[pt]))
    return refs

它有效,但既不优雅也不高效。 所以我尝试了更多的pythonic版本:

def FindRefs(a):
    box = [(n*w,m*h) for n in range(0,8) for m in range(0,8)]
    flatinds = [a[b[1]:h+b[1],b[0]:w+b[0]].argmax() for b in box]
    unravels = np.unravel_index(flatinds, (h, w))
    ur = [(unravels[1][n],unravels[0][n]) for n in range(0,len(box))]
    absinds = [map(sum,zip(box[n],ur[n])) for n in range(0,len(box))]
    refs = [(absinds[n][0],absinds[n][1],a[absinds[n][1],absinds[n][0]]) for n in range(0,len(box))] 
    return refs

它工作正常,但令我惊讶的是,它并不比以前的版本更有效!

问题是:是否有更聪明的方法来完成任务?

请注意,效率很重要,因为我有许多大型数组可供处理。

欢迎任何线索。 :)

1 个答案:

答案 0 :(得分:2)

试试这个:

from numpy.lib.stride_tricks import as_strided as ast
import numpy as np
def FindRefs3(a):
    box = tuple(x/8 for x in a.shape)
    z=ast(a, \
          shape=(8,8)+box, \
          strides=(a.strides[0]*box[0],a.strides[1]*box[1])+a.strides)
    v3 = np.max(z,axis=-1)
    i3r = np.argmax(z,axis=-1)
    v2 = np.max(v3,axis=-1)
    i2 = np.argmax(v3,axis=-1)
    i2x = np.indices(i2.shape)
    i3 = i3r[np.ix_(*[np.arange(x) for x in i2.shape])+(i2,)]
    i3x = np.indices(i3.shape)
    ix0 = i2x[0]*box[0]+i2
    ix1 = i3x[1]*box[1]+i3
    return zip(np.ravel(ix0),np.ravel(ix1),np.ravel(v2))

请注意,您的第一个FindRefs会反转索引,因此对于元组(i1,i2,v),[i1,i2]不会返回正确的值,而[i2,i1]会返回。< / p>

所以这里是代码的作用:

  • 首先根据数组的大小计算每个框需要的尺寸(box)。请注意,这不会进行任何检查:您需要将可以的数组均匀地划分为8 x 8网格。
  • 然后z ast是最混乱的一点。它需要2d数组,并将其转换为 4d 数组。 4d数组有尺寸(8,8,方框[0],方框[1]),因此它可以让你选择你想要的盒子(前两个轴),然后选择你想要的盒子位置(接下来的两个) 。这使我们可以通过在最后两个轴上进行操作来同时处理所有框。
  • v3为我们提供了最后一个轴的最大值:换句话说,它包含每个框中每列的最大值。 i3r包含框中哪一行包含最大值的索引。
  • v2沿着自己的最后一个轴取最大v3,现在处理框中的行:它取最大列,并找到它们的最大值,以便{{ 1}}是一个2d数组,包含每个框的最大值。 如果您想要的只是最大值,那么这就是您所需要的。
  • v2是包含最大值的框中列的索引。
  • 现在我们需要获取框中行的索引......这很棘手。 i2包含框中每列最大行的索引,但我们希望在i2中指定的特定列的行。我们通过使用i3r选择i3r中的元素来实现此目的,这会给我们i2
  • 此时,i3i2是8个8个数组,包含相对于每个框的最大值的行索引和列索引。我们想要绝对指数。所以我们创建i3i2x(实际上,这是毫无意义的;我们可以创建一个,因为它们是相同的),它们只是i3x和{的索引的数组{1}}是(0,1,2,...,8等在一个维度上,依此类推)。然后我们将它们乘以框大小,并添加相对最大索引,以获得绝对最大索引。
  • 然后我们将它们组合起来以获得与您相同的输出。请注意,如果将它们保留为数组,而不是制作元组,它会更快。