Question

在我的数据框中，我有一列名为authors。在此作者列中，每个单元格包含一个元素列表。我想做的是将列表分成多列。

此操作背后的原因是轻松使用groupby()和其他熊猫分析方法。特别是，我的下一个目标是查看哪个作者在我的数据集中拥有最多的出版物，哪个作者在哪些期刊中发表的最多。

我所拥有的：

    authors                                 journal
0   ['Savola', 'Petri Heinonen', 'Miller']  2011 Information...
1   ['Mariana Gerber', 'Rossouw von Solms'] Some Journal
2   ['Cyril Onwubiko']                      Some other Journal

我想要的：

    authors                                          journal
    0                  1                   2
0   'Savola'           'Petri Heinonen'    'Miller'  '2011 Information...'
1   'Mariana Gerber'   'Rossouw von Solm'  NaN       'Some Journal'
2   'Cyril Onwubiko'   NaN                 NaN       'Some other Journal'

到目前为止，我已经尝试从authors列创建一个新的数据框：

df2 = df["authors"].apply(pd.Series)
df2

但是我无法理解如何将此数据帧插入原始数据帧。

如何将这个新的df2作为子列添加到原始数据框中？

熊猫从列表到多列作为多级列

0 个答案: