pandas将group by和行组合到列

时间:2017-12-27 11:01:51

标签: python pandas

我试图转换此数据集:

A   B   C
1   x1  a
1   x1  a
1   x1  b
2   x2  b
2   x2  a

进入:

A   B   C1  C2  C3
1   x1  a   a   b
2   x2  b   a   null

df = pd.DataFrame({ 'A': [1, 1, 1, 2, 2],
                'B': ['x1', 'x1', 'x1', 'x2', 'x2'],
                'C': ['a', 'a', 'b', 'b', 'a']
                })

这里的答案在某种程度上是接近的,但枢轴对我来说并不适用。 How to do a transpose a dataframe group by key on pandas?

2 个答案:

答案 0 :(得分:1)

使用groupby + apply -

v = df.groupby(['A' ,'B']).C.apply(lambda x: x.tolist())

df = pd.DataFrame(v.tolist(), index=v.index)\
       .rename(columns=lambda x: x + 1)\
       .add_prefix('C')\
       .reset_index()
df

   A   B C1 C2    C3
0  1  x1  a  a     b
1  2  x2  b  a  None

答案 1 :(得分:1)

您可以使用set_indexunstack

In [196]: (df.set_index(['A', 'B', df.groupby(['A', 'B']).cumcount()+1])['C']
             .unstack()
             .add_prefix('C')
             .reset_index())
Out[196]:
   A   B C1 C2    C3
0  1  x1  a  a     b
1  2  x2  b  a  None