我有一个大数据文件,其中包含3列:a列(DateTimeSeries),b列(不同的ID标记,类型:对象),c列(值,类型:浮点数)
我将DateTimeSeries设置为索引,并希望在15分钟内重新采样,并使用c列中的值(->下采样),b列中的数据应保持不变。
这是我的代码:
df = pd.read_csv('datasheet.csv')
#set to dtype datetime64[ns]
df['Time'] = pd.to_datetime(df['Time'])
#set dtype to float64
df.values = df.values.astype(float)
df.set_index("Time", inplace=True)
r = df.resample('15T').mean()
但是,问题是我在输出中丢失了b列(这对于标识单个值实际上很重要)
如何管理b列?
预先感谢:)