我想从熊猫数据框中完全删除重复项。例如,我有数据框:
location area
0 mountain view 1044ft2
1 palo alto None
2 mountain view 890ft2
3 san carlos 1000ft2
4 belmont None
我想做的是在location
列中找到唯一值,并删除所有完全重复的项目,等等。因此最终产品看起来像这样(注意mountain view
已经消失了):
location area
1 palo alto None
3 san carlos 1000ft2
4 belmont None
谢谢。
答案 0 :(得分:2)
使用
df.drop_duplicates(subset='location', keep=False)