与this question几乎相同。但是我需要在pandas
数据框中找到答案。
我想为每个分区删除重复的值。
当前数据框:
id | phone_number | last_4_digit
1 | 012345678 | 5678
1 | 6212345678 | 5678
1 | 054234123 | 4123
2 | 121215678 | 5678
2 | 893252345 | 2345
预期的数据框:
id | phone_number | last_4_digit
1 | 012345678 | 5678
1 | 054234123 | 4123
2 | 121215678 | 5678
2 | 893252345 | 2345
我想为last_4_digit
的每个分区删除具有相同id
的行。进行.drop_duplicates('last_4_digit')
无济于事,因为它将其他id
与相同的last_4_digit
删除。同样,使用.drop_duplicates('phone_number')
也无济于事,因为它不会删除重复的last_4_digit
。
你有什么主意吗?