我的数据如下所示
Date Time Route
12Feb2018 12.17.00 NYC-BOS
12Feb2018 12.19.14 NYC-BOS
12Feb2018 21.07.05 SGF-XNA
13Feb2018 11.17.00 NYC-BOS
13Feb2018 11.19.14 NYC-BOS
13Feb2018 22.07.05 SGF-XNA
我想看看在15分钟的差距内出行的是什么。
这就是我所做的,
我已将时间转换为分钟并存储为分钟列。
我使用下面的代码创建Matrix以查看所有可能的差异组合
df2 = pd.DataFrame(np.abs(np.subtract.outer(data.mins, data.mins)), data.Route, data.Route)
df2
然后我把它叠在一起
stacked = df2.stack()
dis = pd.DataFrame({'Routes': stacked.index.to_series(), 'Diff': stacked})[['Routes', 'Diff']].reset_index(drop=True)
现在,我正在基于diff列过滤..
有没有办法只做相距15分钟的路线频率,也可以根据日期而不经过矩阵方法。原因是它没有运行大数据
示例,输出应该类似于
Date Route Frequency
12Feb2018 NYC-BOS 2
12Feb2018 SGF-XNA 4
13Feb2018 NYC-BOS 3