Pandas:根据另一列中的值对第二列进行分组

时间:2017-08-01 11:46:48

标签: pandas dataframe pandas-groupby

我对python / pandas很陌生,我的数据框看起来像这样:

 id         name        color
id_1        alex        blue
id_2        james       yellow
id_1        sara        black
id_4        dave        pink
id_4        lin         grey
id_2        aly         red

我想按ID分组,并将其他两列中的值作为列表获取:

  id           name              color
id_1        [alex,sara]       [blue,black]
id_2        [james,aly]       [yellow,red]
id_4        [dave,lin]        [pink,grey]

有一种简单的方法吗?

1 个答案:

答案 0 :(得分:4)

使用tolist自定义功能groupbyagg

df = df.groupby('id').agg(lambda x: x.tolist())
print (df)
              name          color
id                               
id_1  [alex, sara]  [blue, black]
id_2  [james, aly]  [yellow, red]
id_4   [dave, lin]   [pink, grey]