熊猫从列表到多列作为多级列

时间:2019-10-08 15:07:51

标签: python python-3.x pandas dataframe

在我的数据框中,我有一列名为authors。 在此作者列中,每个单元格包含一个元素列表。我想做的是将列表分成多列。

此操作背后的原因是轻松使用groupby()和其他熊猫分析方法。特别是,我的下一个目标是查看哪个作者在我的数据集中拥有最多的出版物,哪个作者在哪些期刊中发表的最多。

我所拥有的:

    authors                                 journal
0   ['Savola', 'Petri Heinonen', 'Miller']  2011 Information...
1   ['Mariana Gerber', 'Rossouw von Solms'] Some Journal
2   ['Cyril Onwubiko']                      Some other Journal

我想要的:

    authors                                          journal
    0                  1                   2
0   'Savola'           'Petri Heinonen'    'Miller'  '2011 Information...'
1   'Mariana Gerber'   'Rossouw von Solm'  NaN       'Some Journal'
2   'Cyril Onwubiko'   NaN                 NaN       'Some other Journal'


到目前为止,我已经尝试从authors列创建一个新的数据框:

df2 = df["authors"].apply(pd.Series)
df2

但是我无法理解如何将此数据帧插入原始数据帧。

如何将这个新的df2作为子列添加到原始数据框中?

0 个答案:

没有答案