我挣扎了一段时间,使用语法来为dask数据帧按组计算滚动功能。文档非常好,但在这种情况下没有示例。
我的工作版本如下,来自包含带有用户ID和x,y和z列的文本字段的csv:
ddf = read_csv('./*.csv')
ddf.groupby(ddf.User).x.apply(lambda x: x.rolling(5).mean(), meta=('x', 'f8')).compute()
这是dask DataFrames中由group应用的滚动函数的推荐语法,还是推荐的替代方法?
答案 0 :(得分:0)
为了在结果中保留组:
ddf.groupby(by=User).apply(lambda df_g: df_g['x'].rolling(5).mean(), meta=('x', 'f8')).compute()