给定一个点列表,我如何在KDTree中获取它们的索引?
from scipy import spatial
import numpy as np
#some data
x, y = np.mgrid[0:3, 0:3]
data = zip(x.ravel(), y.ravel())
points = [[0,1], [2,2]]
#KDTree
tree = spatial.cKDTree(data)
# incices of points in tree should be [1,8]
我可以这样做:
[tree.query_ball_point(i,r=0) for i in points]
>>> [[1], [8]]
这样做是否有意义?
答案 0 :(得分:0)
使用cKDTree.query(x, k, ...)
查找给定点x
的 k 最近邻居:
distances, indices = tree.query(points, k=1)
print(repr(indices))
# array([1, 8])
在诸如此类的简单情况下,您的数据集和查询点集都很小,并且每个查询点与数据集中的单个行相同,使用简单的布尔运算与广播会更快而不是构建和查询kD树:
data, points = np.array(data), np.array(points)
indices = (data[..., None] == points.T).all(1).argmax(0)
data[..., None] == points.T
广播到(nrows, ndims, npoints)
数组,对于较大的数据集,这可能会在内存方面迅速变得昂贵。在这种情况下,您可能会从正常的for
循环或列表理解中获得更好的性能:
indices = [(data == p).all(1).argmax() for p in points]