Question

我有一个数据集，让我们说：

Column with duplicates        value1       value2
        1                        5            0
        1                        0            9

我想要的是什么

Column with duplicates        value1       value2
        1                        5            9

我无法弄清楚如何让它发挥作用。我得到的最接近的是使用合并，但这给我留下了不同的后缀。

有什么想法吗？

我的真实数据如下：

trial      Time       1    2      3      4
1         '0-100'     0    100    0      0
1         '0-100'     32    0     0      0
1         '100-200'   0     0    100     0
.
.
.
2         '0-100'     0    100    0      0

我希望将试验分开，然后合并时代

Answer 1

IIUC，您可以使用groupby然后聚合：

>>> df
   Column with duplicates  value1  value2
0                       1       5       0
1                       1       0       9

[2 rows x 3 columns]
>>> df.groupby("Column with duplicates", as_index=False).sum()
   Column with duplicates  value1  value2
0                       1       5       9

[1 rows x 3 columns]

在OP的更新示例中：

>>> df
   trial       Time   1    2    3  4
0      1    '0-100'   0  100    0  0
1      1    '0-100'  32    0    0  0
2      1  '100-200'   0    0  100  0
3      2    '0-100'   0  100    0  0

[4 rows x 6 columns]
>>> df.groupby("trial", as_index=False).sum()
   trial   1    2    3  4
0      1  32  100  100  0
1      2   0  100    0  0

[2 rows x 5 columns]

将Pandas DataFrames与相同的列名合并

1 个答案: