如何使用熊猫测量XY点之间的距离

时间:2018-10-15 05:34:28

标签: python pandas loops math

我有code可以测量XY坐标之间的距离,但是我希望通过使用pandas来提高效率。

假设我具有某些主题的XY坐标:

id_X = [1,2,7,19] #Subject 1
id_Y = [2,5,5,7] #Subject 1
cd_X = [3,3,8,20] #Subject 2
cd_Y = [2,5,6,7] #Subject 2

我想用另一个重要的XY坐标来衡量这些主题的距离:

Factor_X = [10,20,30,20] #Important XY
Factor_Y = [2,5,6,7] #Important XY

为了获得第一个主题的距离,我使用以下内容并在每一行中进行迭代。

dist = math.sqrt(((id_X[0] - Factor_X[0])**2)+((id_Y[0] - Factor_Y[0])**2))

我将交换第二个主题的距离id_X id_Y换成cd_Xcd_Y

如果我有很多科目,这将变得效率很低。因此,我正在尝试通过pandas实现相同的概念。

以下是我的尝试:

d = ({                
    'id_X' : [1,2,7,19], 
    'id_Y' : [2,5,5,7], 
    'cd_X' : [3,3,8,20], 
    'cd_Y' : [2,5,6,7],
    'Factor_X' : [10,20,30,20], 
    'Factor_Y' : [2,5,6,7],          
     })

df = pd.DataFrame(data= d)

df['distance'] = math.sqrt(((df['id_X']-df['Factor_X'])**2)+((df['id_Y']-df['Factor_Y'])**2))
df['distance'] = math.sqrt(((df['cd_X']-df['Factor_X'])**2)+((df['cd_Y']-df['Factor_Y'])**2))

但这会返回错误:

TypeError: cannot convert the series to <class 'float'>

预期输出:

   id_X  id_Y  cd_X cd_Y  Factor_X  Factor_Y  id_distance  cd_distance
0  1     2     3    2     10        2         9            7
1  2     5     3    5     20        5         18           17
2  7     5     8    6     30        6         23           22
3  19    7     20   7     20        7         1            0

这种方法是否可行,会创造出更省时的方法?

1 个答案:

答案 0 :(得分:0)

过滤掉idcd并照常进行。

ids = df.filter(like='id')
cds = df.filter(like='cd')  
factor = df.filter(like='Factor')

df['id_distance'] = ((ids.values - factor.values) ** 2).sum(1) ** .5
df['cs_distance'] = ((cds.values - factor.values) ** 2).sum(1) ** .5

df 
   id_X  id_Y  cd_X  cd_Y  Factor_X  Factor_Y  id_distance  cs_distance
0     1     2     3     2        10         2     9.000000          7.0
1     2     5     3     5        20         5    18.000000         17.0
2     7     5     8     6        30         6    23.021729         22.0
3    19     7    20     7        20         7     1.000000          0.0