如何显示彼此相隔15分钟的记录频率

时间:2018-05-22 15:27:14

标签: python-3.x pandas dataframe data-mining

我的数据如下所示

Date          Time         Route         
12Feb2018    12.17.00      NYC-BOS
12Feb2018    12.19.14      NYC-BOS
12Feb2018    21.07.05      SGF-XNA
13Feb2018    11.17.00      NYC-BOS
13Feb2018    11.19.14      NYC-BOS
13Feb2018    22.07.05      SGF-XNA

我想看看在15分钟的差距内出行的是什么。

这就是我所做的,

我已将时间转换为分钟并存储为分钟列。

我使用下面的代码创建Matrix以查看所有可能的差异组合

df2 = pd.DataFrame(np.abs(np.subtract.outer(data.mins, data.mins)), data.Route, data.Route)
df2

此代码的输出如下: enter image description here

然后我把它叠在一起

stacked = df2.stack()
dis = pd.DataFrame({'Routes': stacked.index.to_series(), 'Diff': stacked})[['Routes', 'Diff']].reset_index(drop=True)

输出是 enter image description here

现在,我正在基于diff列过滤..

有没有办法只做相距15分钟的路线频率,也可以根据日期而不经过矩阵方法。原因是它没有运行大数据

示例,输出应该类似于

Date         Route     Frequency
12Feb2018    NYC-BOS     2
12Feb2018    SGF-XNA     4
13Feb2018    NYC-BOS     3

0 个答案:

没有答案