熊猫:Groupby外部触发器(时间序列)

时间:2018-12-21 01:51:46

标签: python time-series pandas-groupby

我在一个数据帧中得到了一些时间序列分析的结果:在不规则时期(取决于车辆行驶的时间),在这段时间内车辆疯狂行驶的距离内建立了总和。

现在,我想将此结果与另一个数据集进行比较。但是在第二个数据集中,我每分钟都有一个定期的时间戳。因此,我很容易获得第二个数据集中距离的每日总和。

因此,首先,我仅在两个数据集上创建一个groupby,并按日期分组。有时看起来不错,但有时车辆会在午夜行驶。

我已经从第一个数据帧中获取了每天最后一个曲目的结束时间,现在我想将当天的最后一个时间戳用作外部触发器,因此在新数据集上建立一个groupby,所以我再次可以建立一个总和。

在这里,我尝试构建一个样本数据集,只要实际数据足够大,就可以手工将这个示例放在一起:

df1 = pd.DataFrame({'StartData': ['2018.12.02 23:08:59', '2018.12.02 23:12:25'], 
'EndDate': ['2018.12.02 23:08:59', 2018.12.03 00:15:58],
'DistanceTrack': [5.01900, 72.00100]})

df2 = pd.DataFrame({'Date': ['2018.12.02 23:48:00', '2018.12.02 23:49:00', '2018.12.02 23:50:00', '2018.12.02 23:51:00', '2018.12.02 23:52:00','2018.12.02 23:53:00', '2018.12.02 23:54:00', '2018.12.02 23:55:00', '2018.12.02 23:56:00', '2018.12.02 23:57:00', '2018.12.02 23:58:00', '2018.12.02 23:59:00', '2018.12.03 00:00:00', '2018.12.03 00:01:00', '2018.12.03 00:02:00', '2018.12.03 00:03:00', '2018.12.03 00:04:00', '2018.12.03 00:05:00', '2018.12.03 00:06:00', '2018.12.03 00:07:00', '2018.12.03 00:08:00', '2018.12.03 00:09:00'],
'km': [113117, 113118, 113119, 113120, 113121, 113122,113123, 113124, 113125, 113126, 113127, 113128, 113129, 113130, 113131, 113132, 113133, 113134, 113135, 113137,113138,113139]})   

1 个答案:

答案 0 :(得分:0)

将第一个数据集转换为您的偏好Pandas time man