Dask Dataframe groupby没有len()

时间:2018-02-10 23:24:48

标签: python dataframe dask

如果你有一个基于dask数据帧的groupby对象,为什么echo会返回错误? (错误或功能)

1 个答案:

答案 0 :(得分:3)

这还没有实施。您可能想提出一个问题(或者更好的是,拉取请求)。务实地说,我只会在你的分组对象上调用nunique

之前

g = df.groupby(df.x + df.y)
result = len(g)

result = (df.x + df.y).nunique()

操作上这更好,因为它可能是惰性的(Python中的len的结果必须是一个具体的整数)并且因为你可以选择nunique_approx变体,它会快得多。