大熊猫:根据列值删除重复的多个条件

时间:2020-04-10 16:17:02

标签: python pandas dataframe

我有一个大型的多索引数据框,其中有很多列,并且有很多重复的时间戳。

现在我要删除重复项,但问题是我想保留第1列的最大值和其他列的最后一个值。

timestep        headers
        col1    col2    col3
1       2       5       6
1       1       3       4
2       3       5       6
2       4       7       8


Should give


timestep        headers
        col1    col2    col3
1       2       3       4
2       4       7       8

1 个答案:

答案 0 :(得分:1)

如果您在索引上.groupby(),则可以获取每一列的.max()

df.groupby(df.index).max()
   col1  col2  col3
1     2     3     4
2     4     7     8