在每个网格单元中查找数组的索引?

时间:2014-03-19 13:02:10

标签: python numpy matplotlib scipy

我有一组数据。它们分布在x-y位置,但它们具有其他特征,如大小。我喜欢在x-y平面中对数据进行网格化,然后获取每个点的网格索引,然后计算每个网格单元格中大小的均值或标准差。我想看看是否与x-y平面中的位置有相关性。旧的方式是编写两个循环并制作一个3D矩阵来保持每个单元格中的数据索引。我想知道在numpy或python中是否有一个类来执行此操作?

我知道我可以使用np.histogram2d,但它只返回每个网格中的点数,但不返回每个点中数组的索引,或者matplotlib.mlab.griddata以某种方式在网格单元格之间进行插值,但我不会&#39 ; t想要任何插值。我只想获得每个网格单元格中的点索引。

xmin=min(Xpos);xmax=max(Xpos)
ymin=min(Ypos);ymax=max(Ypos)
ngridx = 10
ngridy = 10

xi = np.linspace(np.floor(xmin),np.ceil(xmax),ngridx)
yi = np.linspace(np.floor(ymin),np.ceil(ymax),ngridy)
H, xedges, yedges = np.histogram2d(Ypos, Xpos, bins=(xi, yi), normed=False)

np.histogram2d的输出如下所示:

>>>H
array([[  17.,  114.,  301.,  321.,  308.,  163.,  171.,  298.,  316.],
       [ 223.,  211.,  291.,  323.,  282.,  195.,  263.,  198.,  174.],
       [ 304.,  312.,  322.,  295.,  218.,  295.,  259.,  209.,   80.],
       [ 204.,  260.,  298.,  261.,  296.,  241.,   47.,  133.,  189.],
       [ 270.,  265.,  245.,  265.,  286.,  236.,  108.,  214.,  275.],
       [ 276.,  198.,  275.,  235.,  261.,  267.,  223.,  306.,  282.],
       [ 246.,   60.,   88.,  189.,  259.,  225.,  302.,  306.,  328.],
       [ 292.,  138.,    0.,  141.,  297.,  308.,  314.,  276.,  317.],
       [ 169.,  203.,   67.,  220.,  261.,  306.,  329.,  250.,  277.]])

但我想在每个网格单元格中获取索引。我看起来是最快的方式。 我提出了这个想法。我不知道这是否是最好的方式:

for i in range(len(xi)-1):
    for j in range(len(yi)-1):
        bxlow=(Xpos>xi[i]); bxup=(Xpos<=xi[i+1])
        bx=bxlow*bxup
        bylow=(Ypos>yi[j]); byup=(Ypos<=yi[j+1])
        by=bylow*byup
        bprim=bx*by

使用bprim来区分网格中的数据。 还有更好的建议吗?

1 个答案:

答案 0 :(得分:0)

可能你正在寻找numpy.indices?

http://docs.scipy.org/doc/numpy/reference/generated/numpy.indices.html

类似的东西:

 row, col = np.indices( H.shape )

会得到你想要的东西。

或者,您可能需要x,y坐标?在那种情况下,

np.meshgrid(xi,yi)