我有一个包含七个独特载具的数据集。每行都有车辆ID(vID),时间戳,经度(lng)和纬度(lat)。但是,并非每辆车都有相同数量的数据(一辆车可能有20行,另一辆车可能有30行)。此外,车辆没有相同的时间戳。时间戳可能会变化几秒钟。
在我的数据集中,有一辆我感兴趣的车辆。我想从我的数据集中绘制距离该车辆50米以内的车辆数量。
我不确定,执行此任务的最佳方法是什么。
由于缺乏更好的主意,我想将时间戳取整到一分钟。然后计算我的特定车辆的经纬度平均值,并使用以下方法计算其他车辆与我的车辆之间的距离:
from geopy import distance
dist = distance.distance(vehicle, specific_vehicle).m)
该距离然后将被存储在新列中。 然后,我想检查每一行是否距离小于50.0,并创建一个新列(nearVeh),在其中存储True或False结果。然后删除所有带有False的行。之后,我想在对已删除的行进行计数的同时删除vID和时间戳相同的重复行,在该计数上加1(对于剩余的行)并将其存储在新的行计数中。>
我意识到这不是解决当前问题的好方法,但是我目前尚无主意。有没有更好的方法来解决这个问题?