pandas groupby对象到数据帧

时间:2018-02-12 15:45:48

标签: python pandas dataframe

import pandas as pd
df1 = pd.DataFrame( {"name" : ["name1", "name1", "name2", "name3", "name3" , "name3"], "item" : ["item1", "item2", "item3", "item2", "item3", "item1"] } )
df2 = df1.groupby('name')['item']

在这个groupby对象中,我有每个名字的所有项目。我可以通过以下方式看到这一点:

print(df2.apply(list))

并获得:

name
name1           [item1, item2]
name2                  [item3]
name3    [item2, item3, item1]
然而,我想要达到的目标是:

name     itemA    itemB    itemC
name1    item1    item2    NaN
name2    item3    NaN      NaN
name3    item2    item3    item1

非常感谢任何帮助。

2 个答案:

答案 0 :(得分:2)

在df2

的末尾添加apply pd.Series
df2.apply(list).apply(pd.Series)
Out[300]: 
           0      1      2
name                      
name1  item1  item2    NaN
name2  item3    NaN    NaN
name3  item2  item3  item1

答案 1 :(得分:-1)

Wen's answer

中添加了列名
>>> df3 = df2.apply(list).apply(pd.Series)
>>> df3.columns = ['itemA', 'itemB', 'itemC']
# df3 = df3.rename(columns={0: 'itemA', 1: 'itemB', 2: 'itemC'})
>>> df3
       itemA  itemB  itemC
name                      
name1  item1  item2    NaN
name2  item3    NaN    NaN
name3  item2  item3  item1