使用pandas对数据进行分组

时间:2017-04-22 17:30:31

标签: python pandas

我正在使用熊猫进行论文作业,并被困在以下

我的数据如下所示我在第二列中有多个全名的条目,其中有一个authID。

   Full_Name           author_ID
   SVANTE ARRHENIUS      5C5007F5
   SVANTE ARRHENIUS      76E05190

我正在尝试更新数据,因此每个作者都有一行,第二列中包含所有相应的authorID:

     Full_Name               author_ID
    SVANTE ARRHENIUS       [5C5007F5,76E05190]

很抱歉,如果这是一个非常基本的问题。我已经坚持了一段时间而无法理解:(

1 个答案:

答案 0 :(得分:0)

假设您创建了一个数据框对象:

     DF_obj=DataFrame([['Ravi',1234],['Ragh',12345],['Ravi',14567]])

     DF_obj.columns=['Full_Name','Author_ID']

     group_by=DF_obj.groupby('Full_Name')['Author_ID'].apply(list)
     group_by

     Out[]
        Full_Name
        Ragh          [12345]
        Ravi    [1234, 14567]
        Name: Author_ID, dtype: object