我有一个带有一堆经纬度坐标的pandas / python数据框。我想找到一个中心点到这些点之间的距离,因此我可以找出在距该中心点一定距离内有多少个点。
我知道haversine方程,并且已经找到了它的python函数,但是我似乎无法弄清楚如何在数据帧中使用它。
我不介意尝试类似的操作,这样我就可以创建一个新的各自距离的列。
def haversine(lon1, lat1, lon2, lat2):
"""
Calculate the great circle distance between two points
on the earth (specified in decimal degrees)
"""
# convert decimal degrees to radians
lon1, lat1, lon2, lat2 = map(radians, [lon1, lat1, lon2, lat2])
# haversine formula
dlon = lon2 - lon1
dlat = lat2 - lat1
a = sin(dlat/2)**2 + cos(lat1) * cos(lat2) * sin(dlon/2)**2
c = 2 * asin(sqrt(a))
r = 3956 # Radius of earth in miles. Use 6371 for km
return c * r
新建一个列,其中中心坐标为15.845和160.733。
df['dist'] = haversine(15.845, 160.733, df[lat], df['lon'])
我尝试了一些尝试,并且经常收到一些随机错误,但这些功能似乎与我的df元素不一致(我已经转换为float64了)。
任何帮助将不胜感激。