我正在尝试为一系列数据计算分组rolling_std
并继续获得值错误cannot reindex from a duplicate axis
。我认为从基本的谷歌搜索它指的是trip_id
是一系列重复的事实,但我之前使用相同的数据集分组和应用函数,所以我无法理解为什么它在某些方面起作用而不是在其他人。这两个功能都可以自行运行。
希望SO可以教育我。
代码:
df['std'] = df.groupby('trip_id')['knots'].apply(pd.rolling_std,2,min_periods=1)
DF:
trip_id knots
time
2016-01-03 23:42:20 18526 0.233261
2016-01-03 23:43:16 18526 8.572334
2016-01-03 23:43:15 18527 0.252699
2016-01-03 23:42:49 18528 6.434110
2016-01-03 23:42:48 18528 0.719221