时间序列数据的重新采样和插值

时间:2020-02-17 17:46:25

标签: python pandas dataframe time-series

我有来自50个不同传感器的数据,这些传感器的采样不同步。他们通常每10分钟记录一次数据,但也有异常情况,它们以较高的频率采样并丢失数据。

我正在尝试以10分钟为间隔重新采样数据,例如[10:00 10:10 10:20 .. 11:00]。

首先,我尝试将这些时间添加到索引中,然后对它们的值进行插值。 在下面找到代码段。

import pandas as pd


df = pd.read_csv("C:\Sensors Data\\" + "Temperature_Sensor_1" +".csv")
df['Date'] = pd.to_datetime(df['Date'], format = '%m/%d/%Y %I:%M %p')
df = df.set_index('Date')
df.asfreq(freq='10M')

df.to_csv("Test" + ".csv", index=False, encoding='utf-8-sig')

但是我在尝试重新采样时收到以下错误。

_can_reindex中的文件“ C:\ ProgramData \ Anaconda3 \ lib \ site-packages \ pandas \ core \ indexes \ base.py”,行3099引发ValueError(“无法从重复轴重新索引”)

ValueError:无法从重复的轴重新索引

在数据样本下方找到。

enter image description here

0 个答案:

没有答案