合并两个时间序列以协调丢失的数据和偏移时间索引

时间:2019-02-04 20:15:47

标签: python pandas

我有一个传感器(物联网样式),它在Pandas DataFrame中以时间序列记录当前信息和其他一些信息。

设备将数据实时发送到数据库,并且还将信息记录到闪存中。

我注意到闪存中的数据在时间上存在偏移-测量值相同,但不幸的是DateTimeIndex值不同。

处理此问题的最佳方法是什么?

我认为使用其他列数据执行合并会很有用,但是我不熟悉执行此操作的最佳方法。

此外,闪存数据缺少的值更少(由于实时上传数据时互联网连接问题)

我尝试在“ channel_1_current”列上进行合并,但似乎无法正常工作。我认为“如何”的说法不正确。

pd.merge(flash[["channel_1_current","channel_2_current","timestamp_pacific"]],
        non_flash[["channel_1_current","channel_2_current","timestamp_pacific"]],
        left_on='channel_1_current',
        right_on='channel_2_current',
        how='outer')

Flash数据

channel_1_current   timestamp
0   182.032806  2018-12-13 17:07:10
1   182.032806  2018-12-13 17:07:20
2   99.657173   2018-12-13 17:07:30
3   77.710869   2018-12-13 17:07:40
4   66.958908   2018-12-13 17:07:50

非闪存数据

channel_1_current   timestamp
0   182.0328    2018-12-13 17:07:16
1   182.0328    2018-12-13 17:07:27
2   99.65717    2018-12-13 17:07:38
3   77.71087    2018-12-13 17:07:48
4   66.95891    2018-12-13 17:07:57

合并的数据框,可以正确对齐数据框,尤其是填补缺失值的空白。

0 个答案:

没有答案