我在一个数据帧中得到了一些时间序列分析的结果:在不规则时期(取决于车辆行驶的时间),在这段时间内车辆疯狂行驶的距离内建立了总和。
现在,我想将此结果与另一个数据集进行比较。但是在第二个数据集中,我每分钟都有一个定期的时间戳。因此,我很容易获得第二个数据集中距离的每日总和。
因此,首先,我仅在两个数据集上创建一个groupby,并按日期分组。有时看起来不错,但有时车辆会在午夜行驶。
我已经从第一个数据帧中获取了每天最后一个曲目的结束时间,现在我想将当天的最后一个时间戳用作外部触发器,因此在新数据集上建立一个groupby,所以我再次可以建立一个总和。
在这里,我尝试构建一个样本数据集,只要实际数据足够大,就可以手工将这个示例放在一起:
df1 = pd.DataFrame({'StartData': ['2018.12.02 23:08:59', '2018.12.02 23:12:25'],
'EndDate': ['2018.12.02 23:08:59', 2018.12.03 00:15:58],
'DistanceTrack': [5.01900, 72.00100]})
df2 = pd.DataFrame({'Date': ['2018.12.02 23:48:00', '2018.12.02 23:49:00', '2018.12.02 23:50:00', '2018.12.02 23:51:00', '2018.12.02 23:52:00','2018.12.02 23:53:00', '2018.12.02 23:54:00', '2018.12.02 23:55:00', '2018.12.02 23:56:00', '2018.12.02 23:57:00', '2018.12.02 23:58:00', '2018.12.02 23:59:00', '2018.12.03 00:00:00', '2018.12.03 00:01:00', '2018.12.03 00:02:00', '2018.12.03 00:03:00', '2018.12.03 00:04:00', '2018.12.03 00:05:00', '2018.12.03 00:06:00', '2018.12.03 00:07:00', '2018.12.03 00:08:00', '2018.12.03 00:09:00'],
'km': [113117, 113118, 113119, 113120, 113121, 113122,113123, 113124, 113125, 113126, 113127, 113128, 113129, 113130, 113131, 113132, 113133, 113134, 113135, 113137,113138,113139]})