Question

我想从熊猫数据框中完全删除重复项。例如，我有数据框：

  location     area
0  mountain view  1044ft2
1      palo alto     None
2  mountain view   890ft2
3     san carlos  1000ft2
4        belmont     None

我想做的是在location列中找到唯一值，并删除所有完全重复的项目，等等。因此最终产品看起来像这样（注意mountain view已经消失了）：

  location     area
1      palo alto     None
3     san carlos  1000ft2
4        belmont     None

谢谢。

Answer 1

使用

df.drop_duplicates(subset='location', keep=False)