在Pandas Python中查找一列的重复项,其中最后一行包含一列

时间:2017-10-24 13:22:27

标签: python pandas dataframe

我的数据框中有4列user abcisse ordonneetime

我想为每个用户找到具有用户最后一行的重复行,重复行意味着两行具有相同的abcisse和ordonnee。

我正在考虑使用df.duplicated函数,但我不知道如何将它与groupby结合使用?

entry = pd.DataFrame([[1,0,0,1],[1,3,-2,2],[1,2,1,3],[1,3,1,4],[1,3,-2,5],[2,1,3,1],[2,1,3,2]],columns=['user','abcisse','ordonnee','temps'])

output = pd.DataFrame([[1,0,0,1],[1,2,1,3],[1,3,1,4],[1,3,-2,5],[2,1,3,2]],columns=['user','abcisse','ordonnee','temps'])

1 个答案:

答案 0 :(得分:0)

使用drop_duplicates

print (entry.drop_duplicates(['user', 'abcisse', 'ordonnee'], keep='last'))
   user  abcisse  ordonnee  temps
0     1        0         0      1
2     1        2         1      3
3     1        3         1      4
4     1        3        -2      5
6     2        1         3      2