我有一个时间序列的Pandas数据框,它基本上由速度,记录的日期时间和记录该记录的传感器组成。参见下图:
将“ sensor_id”和“ timestamp5”字段分组,并汇总了“ speed”,“ lane”和“ max_speed”。
问题是我想使用timestamp5列进行线性回归,并且由于某种原因我无法访问该字段(这会返回键错误)。
以下是一些代码:
df_aggr.head()
所以ingnore_index=True
返回我在此问题上发布的图片。
答案 0 :(得分:1)
timestamp5现在是一个索引。选中df_aggr.columns
和df_aggr.index
。
df_aggr =( df_parcial.groupby(by=['sensor_id', 'timestamp5'])
.agg({'speed': ['count', 'min', 'max', 'mean', lambda x:x.std(ddof=0), 'sum'],
'lane': 'max',
'max_speed': 'max'})
.reset_index() )