import pandas as pd
df1 = pd.DataFrame( {"name" : ["name1", "name1", "name2", "name3", "name3" , "name3"], "item" : ["item1", "item2", "item3", "item2", "item3", "item1"] } )
df2 = df1.groupby('name')['item']
在这个groupby对象中,我有每个名字的所有项目。我可以通过以下方式看到这一点:
print(df2.apply(list))
并获得:
name
name1 [item1, item2]
name2 [item3]
name3 [item2, item3, item1]
然而,我想要达到的目标是:
name itemA itemB itemC
name1 item1 item2 NaN
name2 item3 NaN NaN
name3 item2 item3 item1
非常感谢任何帮助。
答案 0 :(得分:2)
在df2
的末尾添加apply
pd.Series
df2.apply(list).apply(pd.Series)
Out[300]:
0 1 2
name
name1 item1 item2 NaN
name2 item3 NaN NaN
name3 item2 item3 item1
答案 1 :(得分:-1)
>>> df3 = df2.apply(list).apply(pd.Series)
>>> df3.columns = ['itemA', 'itemB', 'itemC']
# df3 = df3.rename(columns={0: 'itemA', 1: 'itemB', 2: 'itemC'})
>>> df3
itemA itemB itemC
name
name1 item1 item2 NaN
name2 item3 NaN NaN
name3 item2 item3 item1