Python中的欧氏距离

时间:2015-08-21 17:36:13

标签: python numpy scipy distance

我有两个3000x3向量,我想计算它们之间的1对1欧几里德距离。例如,vec1是

1 1 1  
2 2 2    
3 3 3  
4 4 4  
...

vec2是

2 2 2
3 3 3  
4 4 4  
5 5 5  
...

我希望得到结果

1.73205081  
1.73205081
1.73205081
1.73205081
...

我尝试scipy.spatial.distance.cdist(vec1,vec2),它返回3000x3000矩阵,而我只需要主对角线。我也试过了np.sqrt(np.sum((vec1-vec2)**2 for vec1,vec2 in zip(vec1,vec2))),但它并没有为我的目的而努力。有没有办法计算距离?我很感激任何评论。

2 个答案:

答案 0 :(得分:3)

cdist会返回一个3000 x 3000数组,因为它计算两个输入数组中每个行向量之间的距离。

要仅计算相应行索引之间的距离,可以使用np.linalg.norm

a = np.repeat((np.arange(3000) + 1)[:, None], 3, 1)
b = a + 1

dist = np.linalg.norm(a - b, axis=1)

或使用标准矢量化阵列操作:

dist = np.sqrt(((a - b) ** 2).sum(1))

答案 1 :(得分:0)

这是另一种有效的方式。它仍然使用np.linalg.norm函数,但它处理数据,如果这是您需要的。

import numpy as np
vec1='''1 1 1
    2 2 2
    3 3 3
    4 4 4'''
vec2='''2 2 2
    3 3 3
    4 4 4
    5 5 5'''

process_vec1 = np.array([])
process_vec2 = np.array([])

for line in vec1:
    process_vec1 = np.append( process_vec1, map(float,line.split()) )
for line in vec2:
    process_vec2 = np.append( process_vec2, map(float,line.split()) )

process_vec1 = process_vec1.reshape( (len(process_vec1)/3, 3) )
process_vec2 = process_vec2.reshape( (len(process_vec2)/3, 3) )

dist = np.linalg.norm( process_vec1 - process_vec2 , axis = 1 )

print dist

[1.7320508075688772 1.7320508075688772 1.7320508075688772 1.7320508075688772]