我有以下数据集。只有“内部注释”中的数据需要在一个单元格中。除了“内部注释”之外,CaseNumber的所有其他数据都是相同的。 CaseNumber列不是我的数据的索引。
如何将特定CaseNumber的“内部注释”中的所有数据附加到一个单元格中?
答案 0 :(得分:0)
这是一种方式。 groupby.apply(list)
会将每个组的所有internalnotes
汇总到一个列表中。
group_cols = ['CaseNumber', 'ProcessInstanceDescription', 'ProdOpsCaseOwner',
'personname', 'SNLAnalystEntryDesc']
ans_new = ans_new.groupby(group_cols)['internalnotes'].apply(list).reset_index()
如果你真的想加入字符串,正如@jezrael建议的那样,并删除所有关于价值来自不同行的事实的知识:
ans_new = ans_new.groupby(group_cols)['internalnotes'].apply(' '.join).reset_index()