按组语法执行Dask滚动功能

时间:2017-02-11 04:09:37

标签: python dask

我挣扎了一段时间,使用语法来为dask数据帧按组计算滚动功能。文档非常好,但在这种情况下没有示例。

我的工作版本如下,来自包含带有用户ID和x,y和z列的文本字段的csv:

ddf = read_csv('./*.csv')
ddf.groupby(ddf.User).x.apply(lambda x: x.rolling(5).mean(), meta=('x', 'f8')).compute()

这是dask DataFrames中由group应用的滚动函数的推荐语法,还是推荐的替代方法?

1 个答案:

答案 0 :(得分:0)

为了在结果中保留组:

ddf.groupby(by=User).apply(lambda df_g: df_g['x'].rolling(5).mean(), meta=('x', 'f8')).compute()