我有一个数据集,让我们说:
Column with duplicates value1 value2
1 5 0
1 0 9
我想要的是什么
Column with duplicates value1 value2
1 5 9
我无法弄清楚如何让它发挥作用。我得到的最接近的是使用合并,但这给我留下了不同的后缀。
有什么想法吗?
我的真实数据如下:
trial Time 1 2 3 4
1 '0-100' 0 100 0 0
1 '0-100' 32 0 0 0
1 '100-200' 0 0 100 0
.
.
.
2 '0-100' 0 100 0 0
我希望将试验分开,然后合并时代
答案 0 :(得分:2)
IIUC,您可以使用groupby
然后聚合:
>>> df
Column with duplicates value1 value2
0 1 5 0
1 1 0 9
[2 rows x 3 columns]
>>> df.groupby("Column with duplicates", as_index=False).sum()
Column with duplicates value1 value2
0 1 5 9
[1 rows x 3 columns]
在OP的更新示例中:
>>> df
trial Time 1 2 3 4
0 1 '0-100' 0 100 0 0
1 1 '0-100' 32 0 0 0
2 1 '100-200' 0 0 100 0
3 2 '0-100' 0 100 0 0
[4 rows x 6 columns]
>>> df.groupby("trial", as_index=False).sum()
trial 1 2 3 4
0 1 32 100 100 0
1 2 0 100 0 0
[2 rows x 5 columns]