如何在熊猫中保留重复数据

时间:2019-02-28 13:52:05

标签: python pandas dataframe

我的问题可能有点奇怪,但是有什么办法可以做与const notOk: Points = [0].map<Point>(() => [0, 0, 0])相反的事情吗?

我集成了两个不同的数据框,并且有四个不同的列。我想保留重复的行(基于一列),以便我可以研究差异(在其他列中查看更改)。

我刚刚意识到一切都与转储重复的数据有关,而不是保留它们:))。 我试图反转drop_duplicates(),但看来这是不可能的。

有什么办法做这种事吗?

1 个答案:

答案 0 :(得分:0)

drop_duplicates 标识重复的行,然后删除

您应该执行类似的过程:

  • 首先确定重复的行(duplicated函数,其中subset 仅限于您提到的列,而keep=False仅用于查找所有列 重复)。结果是布尔值 Series
  • 删除不重复重复的行。

类似的东西:

df.drop(~df.duplicated(subset="...", keep=False))
相关问题