我有一组数据。它们分布在x-y位置,但它们具有其他特征,如大小。我喜欢在x-y平面中对数据进行网格化,然后获取每个点的网格索引,然后计算每个网格单元格中大小的均值或标准差。我想看看是否与x-y平面中的位置有相关性。旧的方式是编写两个循环并制作一个3D矩阵来保持每个单元格中的数据索引。我想知道在numpy或python中是否有一个类来执行此操作?
我知道我可以使用np.histogram2d
,但它只返回每个网格中的点数,但不返回每个点中数组的索引,或者matplotlib.mlab.griddata
以某种方式在网格单元格之间进行插值,但我不会&#39 ; t想要任何插值。我只想获得每个网格单元格中的点索引。
xmin=min(Xpos);xmax=max(Xpos)
ymin=min(Ypos);ymax=max(Ypos)
ngridx = 10
ngridy = 10
xi = np.linspace(np.floor(xmin),np.ceil(xmax),ngridx)
yi = np.linspace(np.floor(ymin),np.ceil(ymax),ngridy)
H, xedges, yedges = np.histogram2d(Ypos, Xpos, bins=(xi, yi), normed=False)
np.histogram2d
的输出如下所示:
>>>H
array([[ 17., 114., 301., 321., 308., 163., 171., 298., 316.],
[ 223., 211., 291., 323., 282., 195., 263., 198., 174.],
[ 304., 312., 322., 295., 218., 295., 259., 209., 80.],
[ 204., 260., 298., 261., 296., 241., 47., 133., 189.],
[ 270., 265., 245., 265., 286., 236., 108., 214., 275.],
[ 276., 198., 275., 235., 261., 267., 223., 306., 282.],
[ 246., 60., 88., 189., 259., 225., 302., 306., 328.],
[ 292., 138., 0., 141., 297., 308., 314., 276., 317.],
[ 169., 203., 67., 220., 261., 306., 329., 250., 277.]])
但我想在每个网格单元格中获取索引。我看起来是最快的方式。 我提出了这个想法。我不知道这是否是最好的方式:
for i in range(len(xi)-1):
for j in range(len(yi)-1):
bxlow=(Xpos>xi[i]); bxup=(Xpos<=xi[i+1])
bx=bxlow*bxup
bylow=(Ypos>yi[j]); byup=(Ypos<=yi[j+1])
by=bylow*byup
bprim=bx*by
使用bprim
来区分网格中的数据。
还有更好的建议吗?
答案 0 :(得分:0)
可能你正在寻找numpy.indices?
http://docs.scipy.org/doc/numpy/reference/generated/numpy.indices.html
类似的东西:
row, col = np.indices( H.shape )
会得到你想要的东西。
或者,您可能需要x,y坐标?在那种情况下,
np.meshgrid(xi,yi)