Question

我有下面的数据框。

我希望它通过合并一列中具有相同值的单元格将其转换到下面

任何人都可以提供一些示例代码吗？

Answer 1

尝试一下

df.loc[df.duplicated(['A', 'B']),['A', 'B']]=''

获取重复值并将其掩码为空字符串。

I / P：

   A  B  C
0  1  a  A
1  1  a  B
2  2  b  C
3  2  b  A

O / P：

注意：您无法使用熊猫完全合并单元格，其想法是抑制除第一条记录以外的值

Answer 2

基于@mohamed thasin ah生成的示例数据，

df.groupby(['A', 'B'], as_index=False).agg(', '.join)

    A   B   C
0   1   a   A, B
1   2   b   C, A

所以尝试：

df.groupby(['cd', 'ci', 'ui', 'module_behavior', 'feature_behavior', 'at']).agg(', '.join)

Answer 3

您想要的输出似乎是一个Excel文件。如果是这样，我建议：

df.groupby(['cn', 'ci', 'ui', 'module_behaviour', 'feature_behaviour', 'at']).apply(
lambda x: x.sort_values('caseid')).to_excel('filename.xlsx')

Pandas将groupby的那些列转换为多级索引，to_excel将DataFrame保存到默认设置为merge_cells=True的Excel文件中。