Question

我正在使用熊猫进行论文作业，并被困在以下

我的数据如下所示我在第二列中有多个全名的条目，其中有一个authID。

   Full_Name           author_ID
   SVANTE ARRHENIUS      5C5007F5
   SVANTE ARRHENIUS      76E05190

我正在尝试更新数据，因此每个作者都有一行，第二列中包含所有相应的authorID：

     Full_Name               author_ID
    SVANTE ARRHENIUS       [5C5007F5,76E05190]

很抱歉，如果这是一个非常基本的问题。我已经坚持了一段时间而无法理解:(

Answer 1

假设您创建了一个数据框对象：

     DF_obj=DataFrame([['Ravi',1234],['Ragh',12345],['Ravi',14567]])

     DF_obj.columns=['Full_Name','Author_ID']

     group_by=DF_obj.groupby('Full_Name')['Author_ID'].apply(list)
     group_by

     Out[]
        Full_Name
        Ragh          [12345]
        Ravi    [1234, 14567]
        Name: Author_ID, dtype: object

使用pandas对数据进行分组

1 个答案: