Question

我的问题可能有点奇怪，但是有什么办法可以做与const notOk: Points = [0].map<Point>(() => [0, 0, 0])相反的事情吗？

我集成了两个不同的数据框，并且有四个不同的列。我想保留重复的行（基于一列），以便我可以研究差异（在其他列中查看更改）。

我刚刚意识到一切都与转储重复的数据有关，而不是保留它们:)）。我试图反转drop_duplicates()，但看来这是不可能的。

有什么办法做这种事吗？

Answer 1

drop_duplicates 标识重复的行，然后删除。

您应该执行类似的过程：

首先确定重复的行（duplicated函数，其中subset 仅限于您提到的列，而keep=False仅用于查找所有列重复）。结果是布尔值 Series 。
删除不重复重复的行。

类似的东西：

df.drop(~df.duplicated(subset="...", keep=False))