我有一个带有一系列连续地理坐标的df。我想找到这些连续点之间的距离。 1-> 2,2-> 3 ....结束1->结束。
使用df.shift(1)
看起来也不漂亮,也使用循环。
可以使用某些递归函数更优雅地完成它吗?
答案 0 :(得分:0)
import pandas as pd
def calculate_distance(lat_from, long_from, lat_to, long_to):
# some better logic
return lat_from - lat_to + long_from - long_to
df = pd.DataFrame({'long': [1, 2, 4.2, 5, 6], 'lat': [7, 4, 2, 1.2, 2]})
df[['lat_to', 'long_to']] = df.shift(-1)
# this is way faster, but may not be possible depending on your calculation
calculate_distance(df['lat'], df['long'], df['lat_to'], df['long_to'])
>>> 0 2.000000e+00
>>> 1 -2.000000e-01
>>> 2 2.220446e-16
>>> 3 -1.800000e+00
>>> 4 NaN
>>> dtype: float64
# or
# a lot slower, processes on per-row basis
df.apply(lambda row: calculate_distance(row['lat'], row['long'], row['lat_to'], row['long_to']), axis=1)
>>> 0 2.000000e+00
>>> 1 -2.000000e-01
>>> 2 2.220446e-16
>>> 3 -1.800000e+00
>>> 4 NaN
>>> dtype: float64
要进行速度比较,请尝试使用pandas.DataFrame.apply
,pandas.DataFrame.applymap
和常规广播操作之间的区别。