在我的数据框中,我有一列名为authors
。
在此作者列中,每个单元格包含一个元素列表。我想做的是将列表分成多列。
此操作背后的原因是轻松使用groupby()
和其他熊猫分析方法。特别是,我的下一个目标是查看哪个作者在我的数据集中拥有最多的出版物,哪个作者在哪些期刊中发表的最多。
我所拥有的:
authors journal
0 ['Savola', 'Petri Heinonen', 'Miller'] 2011 Information...
1 ['Mariana Gerber', 'Rossouw von Solms'] Some Journal
2 ['Cyril Onwubiko'] Some other Journal
我想要的:
authors journal
0 1 2
0 'Savola' 'Petri Heinonen' 'Miller' '2011 Information...'
1 'Mariana Gerber' 'Rossouw von Solm' NaN 'Some Journal'
2 'Cyril Onwubiko' NaN NaN 'Some other Journal'
到目前为止,我已经尝试从authors
列创建一个新的数据框:
df2 = df["authors"].apply(pd.Series)
df2
但是我无法理解如何将此数据帧插入原始数据帧。
如何将这个新的df2
作为子列添加到原始数据框中?