我正在尝试将dask数据框聚合到指标集,包括中位数,但看起来不支持中位数。有没有机会聚合并获得中位数?
st_agg = df.groupby(['start station id', 'end station id']).agg({'usertype':'count', 'tripduration':'median'})
>>> ValueError: unknown aggregate median
答案 0 :(得分:0)
您可以改为使用 .quantile(0.5):
df.groupby(['group1', 'group2']).apply(lambda x: x.quantile(0.5))