我有来自50个不同传感器的数据,这些传感器的采样不同步。他们通常每10分钟记录一次数据,但也有异常情况,它们以较高的频率采样并丢失数据。
我正在尝试以10分钟为间隔重新采样数据,例如[10:00 10:10 10:20 .. 11:00]。
首先,我尝试将这些时间添加到索引中,然后对它们的值进行插值。 在下面找到代码段。
import pandas as pd
df = pd.read_csv("C:\Sensors Data\\" + "Temperature_Sensor_1" +".csv")
df['Date'] = pd.to_datetime(df['Date'], format = '%m/%d/%Y %I:%M %p')
df = df.set_index('Date')
df.asfreq(freq='10M')
df.to_csv("Test" + ".csv", index=False, encoding='utf-8-sig')
但是我在尝试重新采样时收到以下错误。
_can_reindex中的文件“ C:\ ProgramData \ Anaconda3 \ lib \ site-packages \ pandas \ core \ indexes \ base.py”,行3099引发ValueError(“无法从重复轴重新索引”)
ValueError:无法从重复的轴重新索引
在数据样本下方找到。