dask:如何分组,聚合而不丢失用于groupby的列

时间:2018-02-11 14:42:58

标签: python group-by dask

在对以下数据进行分组时,如何获得SQL样式的分组输出:

   item   frequency
    A      5
    A      9
    B      2
    B      4
    C      6

df.groupby(by = ["item"]).sum()

结果如下:

  item   frequency
    A      14
    B      6
    C      6

在熊猫中,通过设置as_index=False来实现。但是dask没有support this argument in groupby。它目前省略了item列,并返回带有frequency列的系列。

1 个答案:

答案 0 :(得分:4)

之后可能会致电.reset_index吗?