Question

我的数据框中有4列user abcisse ordonnee，time

我想为每个用户找到具有用户最后一行的重复行，重复行意味着两行具有相同的abcisse和ordonnee。

我正在考虑使用df.duplicated函数，但我不知道如何将它与groupby结合使用？

entry = pd.DataFrame([[1,0,0,1],[1,3,-2,2],[1,2,1,3],[1,3,1,4],[1,3,-2,5],[2,1,3,1],[2,1,3,2]],columns=['user','abcisse','ordonnee','temps'])

output = pd.DataFrame([[1,0,0,1],[1,2,1,3],[1,3,1,4],[1,3,-2,5],[2,1,3,2]],columns=['user','abcisse','ordonnee','temps'])

Answer 1

使用drop_duplicates：

print (entry.drop_duplicates(['user', 'abcisse', 'ordonnee'], keep='last'))
   user  abcisse  ordonnee  temps
0     1        0         0      1
2     1        2         1      3
3     1        3         1      4
4     1        3        -2      5
6     2        1         3      2

在Pandas Python中查找一列的重复项，其中最后一行包含一列

1 个答案: