因此,假设我在A中有10,000个点,在B中有10,000个点,并希望找出每个B点中A中最接近的点。
目前,我只是循环遍历B和A中的每个点,以找出哪一个距离最近。即
B = [(.5, 1, 1), (1, .1, 1), (1, 1, .2)]
A = [(1, 1, .3), (1, 0, 1), (.4, 1, 1)]
C = {}
for bp in B:
closestDist = -1
for ap in A:
dist = sum(((bp[0]-ap[0])**2, (bp[1]-ap[1])**2, (bp[2]-ap[2])**2))
if(closestDist > dist or closestDist == -1):
C[bp] = ap
closestDist = dist
print C
但是,我确信有更快的方法可以做到这一点......任何想法?
答案 0 :(得分:4)
在这种情况下,我通常使用kd-tree。
有一个C++ implementation wrapped with SWIG and bundled with BioPython易于使用。
答案 1 :(得分:1)
答案 2 :(得分:1)
你可以使用numpy广播。例如,
from numpy import *
import numpy as np
a=array(A)
b=array(B)
#using looping
for i in b:
print sum((a-i)**2,1).argmin()
将打印2,1,0,它们分别是最接近1,2,3行的行。
否则,您可以使用广播:
z = sum((a[:,:, np.newaxis] - b)**2,1)
z.argmin(1) # gives array([2, 1, 0])
我希望有所帮助。