如何通过熊猫合并csv细胞

时间:2019-08-22 07:58:47

标签: python pandas

我有下面的数据框。

enter image description here

我希望它通过合并一列中具有相同值的单元格将其转换到下面

enter image description here

任何人都可以提供一些示例代码吗?

3 个答案:

答案 0 :(得分:0)

尝试一下

df.loc[df.duplicated(['A', 'B']),['A', 'B']]=''

获取重复值并将其掩码为空字符串。

I / P:

   A  B  C
0  1  a  A
1  1  a  B
2  2  b  C
3  2  b  A

O / P:

   A  B  C
0  1  a  A
1        B
2  2  b  C
3        A

注意:您无法使用熊猫完全合并单元格,其想法是抑制除第一条记录以外的值

答案 1 :(得分:0)

基于@mohamed thasin ah生成的示例数据,

df.groupby(['A', 'B'], as_index=False).agg(', '.join)
    A   B   C
0   1   a   A, B
1   2   b   C, A

所以尝试:

df.groupby(['cd', 'ci', 'ui', 'module_behavior', 'feature_behavior', 'at']).agg(', '.join)

答案 2 :(得分:0)

您想要的输出似乎是一个Excel文件。如果是这样,我建议:

df.groupby(['cn', 'ci', 'ui', 'module_behaviour', 'feature_behaviour', 'at']).apply(
lambda x: x.sort_values('caseid')).to_excel('filename.xlsx')

Pandas将groupby的那些列转换为多级索引,to_excelDataFrame保存到默认设置为merge_cells=True的Excel文件中。