删除重复项,同时保留单元格中的数据

时间:2021-06-28 07:00:33

标签: python-3.x pandas excel-formula

我在 excel 中有一个列表需要整理。我需要从 A 列中删除重复项,同时保留 B 列中重复项中的值并将它们连接起来。有没有办法在 excel 或 Python 中做到这一点?

我需要这样做的原因是我正在处理零件编号及其备用编号的列表。每个替代品都显示在其产品代码旁边的单元格中。具有许多替代品的产品有许多重复品。共有 29,883 个产品代码。

任何帮助都会很棒,因为我是数据清理的新手。enter image description here

1 个答案:

答案 0 :(得分:0)

可能您需要通过对 alt-prod-code 进行分组来聚合 prod-code 的条目。你可以这样做:

df.groupby('prod-code', as_index=False).agg(','.join)

输入

  prod-code alt-prod-code
0    AB0110    22RB.30606
1    AB0110     22RB30606

输出:

  prod-code         alt-prod-code
0    AB0110  22RB.30606,22RB30606