答案 0 :(得分:0)
尝试一下
df.loc[df.duplicated(['A', 'B']),['A', 'B']]=''
获取重复值并将其掩码为空字符串。
I / P:
A B C
0 1 a A
1 1 a B
2 2 b C
3 2 b A
O / P:
A B C
0 1 a A
1 B
2 2 b C
3 A
注意:您无法使用熊猫完全合并单元格,其想法是抑制除第一条记录以外的值
答案 1 :(得分:0)
基于@mohamed thasin ah生成的示例数据,
df.groupby(['A', 'B'], as_index=False).agg(', '.join)
A B C
0 1 a A, B
1 2 b C, A
所以尝试:
df.groupby(['cd', 'ci', 'ui', 'module_behavior', 'feature_behavior', 'at']).agg(', '.join)
答案 2 :(得分:0)
您想要的输出似乎是一个Excel文件。如果是这样,我建议:
df.groupby(['cn', 'ci', 'ui', 'module_behaviour', 'feature_behaviour', 'at']).apply(
lambda x: x.sort_values('caseid')).to_excel('filename.xlsx')
Pandas将groupby
的那些列转换为多级索引,to_excel
将DataFrame
保存到默认设置为merge_cells=True
的Excel文件中。