我在 excel 中有一个列表需要整理。我需要从 A 列中删除重复项,同时保留 B 列中重复项中的值并将它们连接起来。有没有办法在 excel 或 Python 中做到这一点?
我需要这样做的原因是我正在处理零件编号及其备用编号的列表。每个替代品都显示在其产品代码旁边的单元格中。具有许多替代品的产品有许多重复品。共有 29,883 个产品代码。
任何帮助都会很棒,因为我是数据清理的新手。enter image description here
答案 0 :(得分:0)
可能您需要通过对 alt-prod-code
进行分组来聚合 prod-code
的条目。你可以这样做:
df.groupby('prod-code', as_index=False).agg(','.join)
输入
prod-code alt-prod-code
0 AB0110 22RB.30606
1 AB0110 22RB30606
输出:
prod-code alt-prod-code
0 AB0110 22RB.30606,22RB30606