我正在使用熊猫进行论文作业,并被困在以下
我的数据如下所示我在第二列中有多个全名的条目,其中有一个authID。
Full_Name author_ID
SVANTE ARRHENIUS 5C5007F5
SVANTE ARRHENIUS 76E05190
我正在尝试更新数据,因此每个作者都有一行,第二列中包含所有相应的authorID:
Full_Name author_ID
SVANTE ARRHENIUS [5C5007F5,76E05190]
很抱歉,如果这是一个非常基本的问题。我已经坚持了一段时间而无法理解:(
答案 0 :(得分:0)
假设您创建了一个数据框对象:
DF_obj=DataFrame([['Ravi',1234],['Ragh',12345],['Ravi',14567]])
DF_obj.columns=['Full_Name','Author_ID']
group_by=DF_obj.groupby('Full_Name')['Author_ID'].apply(list)
group_by
Out[]
Full_Name
Ragh [12345]
Ravi [1234, 14567]
Name: Author_ID, dtype: object