我试图在P列中删除重复的值,但要根据S列的值。我的意思是S列中的每个组。像根据S组一样,有四个组1,2,3和4。因此,根据第一组,我试图找到值5,7,6,并且第一个索引应该下降。
S A4 P
0 1 1 5
1 1 2 5
2 1 3 7
3 1 4 6
4 2 1 7
5 2 2 6
6 2 3 7
7 2 1 1
8 3 5 2
9 3 3 3
10 3 2 4
11 3 1 1
12 4 5 2
13 4 3 3
14 4 5 4
15 4 6 5
因此,不需要根据S组在P列上的每个重复值。这是我要查找的搜索df:
Search
S A4 P
0 1 1 5
1 1 3 7
2 1 4 6
3 2 1 7
4 2 2 6
5 2 1 1
6 3 5 2
7 3 3 3
8 3 2 4
9 3 1 1
10 4 5 2
11 4 3 3
12 4 5 5
答案 0 :(得分:1)
将drop_duplicates()
与subset
和keep='first'
一起使用:
In [2335]: df.drop_duplicates(sub['S', 'P'], keep='first')
Out[2335]:
S A4 P
0 1 1 5
2 1 3 7
3 1 4 6
4 2 1 7
5 2 2 6
7 2 1 1
8 3 5 2
9 3 3 3
10 3 2 4
11 3 1 1
12 4 5 2
13 4 3 3
14 4 5 4
15 4 6 5