使用python numpy

时间:2018-01-18 00:42:03

标签: python numpy knn

我有一个n点的3d点云,格式为np.array((n,3))。例如,这可能是:

P = [[x1,y1,z1],[x2,y2,z2],[x3,y3,z3],[x4,y4,z4],[x5,y5,z5],.....[xn,yn,zn]]

我希望能够得到每个点的K最近邻居。

所以例如P1的k个最近邻居可能是P2,P3,P4,P5,P6,P2的KNN可能是P100,P150,P2等等。

如何在python中执行此操作?

2 个答案:

答案 0 :(得分:6)

这可以通过scipy.spatial.distance.pdist整齐解决。

首先,让我们创建一个在3D空间中存储点的示例数组:

import numpy as np
N = 10  # The number of points
points = np.random.rand(N, 3)
print(points)

输出:

array([[ 0.23087546,  0.56051787,  0.52412935],
       [ 0.42379506,  0.19105237,  0.51566572],
       [ 0.21961949,  0.14250733,  0.61098618],
       [ 0.18798019,  0.39126363,  0.44501143],
       [ 0.24576538,  0.08229354,  0.73466956],
       [ 0.26736447,  0.78367342,  0.91844028],
       [ 0.76650234,  0.40901879,  0.61249828],
       [ 0.68905082,  0.45289896,  0.69096152],
       [ 0.8358694 ,  0.61297944,  0.51879837],
       [ 0.80963247,  0.1680279 ,  0.87744732]])

我们计算每个点,到所有其他点的距离:

from scipy.spatial import distance
D = distance.squareform(distance.pdist(points))
print(np.round(D, 1))  # Rounding to fit the array on screen

输出:

array([[ 0. ,  0.4,  0.4,  0.2,  0.5,  0.5,  0.6,  0.5,  0.6,  0.8],
       [ 0.4,  0. ,  0.2,  0.3,  0.3,  0.7,  0.4,  0.4,  0.6,  0.5],
       [ 0.4,  0.2,  0. ,  0.3,  0.1,  0.7,  0.6,  0.6,  0.8,  0.6],
       [ 0.2,  0.3,  0.3,  0. ,  0.4,  0.6,  0.6,  0.6,  0.7,  0.8],
       [ 0.5,  0.3,  0.1,  0.4,  0. ,  0.7,  0.6,  0.6,  0.8,  0.6],
       [ 0.5,  0.7,  0.7,  0.6,  0.7,  0. ,  0.7,  0.6,  0.7,  0.8],
       [ 0.6,  0.4,  0.6,  0.6,  0.6,  0.7,  0. ,  0.1,  0.2,  0.4],
       [ 0.5,  0.4,  0.6,  0.6,  0.6,  0.6,  0.1,  0. ,  0.3,  0.4],
       [ 0.6,  0.6,  0.8,  0.7,  0.8,  0.7,  0.2,  0.3,  0. ,  0.6],
       [ 0.8,  0.5,  0.6,  0.8,  0.6,  0.8,  0.4,  0.4,  0.6,  0. ]])

您可以这样读取此距离矩阵:第1点和第5点之间的距离为distance[0, 4]。您还可以看到每个点与其自身之间的距离为0,例如distance[6, 6] == 0

我们argsort距离矩阵的每一行为每个点得到哪个点最接近的列表:

closest = np.argsort(D, axis=1)
print(closest)

输出:

[[0 3 1 2 5 7 4 6 8 9]
 [1 2 4 3 7 0 6 9 8 5]
 [2 4 1 3 0 7 6 9 5 8]
 [3 0 2 1 4 7 6 5 8 9]
 [4 2 1 3 0 7 9 6 5 8]
 [5 0 7 3 6 2 8 4 1 9]
 [6 7 8 9 1 0 3 2 4 5]
 [7 6 8 9 1 0 3 2 4 5]
 [8 6 7 9 1 0 3 5 2 4]
 [9 6 7 1 8 4 2 0 3 5]]

同样,我们看到每个点都与自身最接近。所以,无视这一点,我们现在可以选择最近的k点:

k = 3  # For each point, find the 3 closest points
print(closest[:, 1:k+1])

输出:

[[3 1 2]
 [2 4 3]
 [4 1 3]
 [0 2 1]
 [2 1 3]
 [0 7 3]
 [7 8 9]
 [6 8 9]
 [6 7 9]
 [6 7 1]]

例如,我们看到对于第4点,k = 3个最近点是1,3和2。

答案 1 :(得分:0)

@ marijn-van-vliet的解决方案在大多数情况下都可以满足。但是,它被称为
brute-force 方法,如果点云相对较大或如果您具有计算/时间约束,则可能需要查看构建KD树以快速检索K的方法。 -点的最近邻居。

在python中,sklearn库在此处提供了易于使用的实现:sklearn.neighbors.KDTree

from sklearn.neighbors import KDTree
tree = KDTree(pcloud, leaf_size=40)

# For finding K neighbors
indices, distances = tree.query(K)

(有关其他用法和输出的更多信息,请参见另一篇文章中的以下答案:https://stackoverflow.com/a/48127117/4406572

许多其他库确实具有基于KD-Tree的KNN检索的实现,包括Open3D (FLANN based)scipy