我的问题可能有点奇怪,但是有什么办法可以做与const notOk: Points = [0].map<Point>(() => [0, 0, 0])
相反的事情吗?
我集成了两个不同的数据框,并且有四个不同的列。我想保留重复的行(基于一列),以便我可以研究差异(在其他列中查看更改)。
我刚刚意识到一切都与转储重复的数据有关,而不是保留它们:))。
我试图反转drop_duplicates()
,但看来这是不可能的。
有什么办法做这种事吗?
答案 0 :(得分:0)
drop_duplicates
标识重复的行,然后删除。
您应该执行类似的过程:
duplicated
函数,其中subset
仅限于您提到的列,而keep=False
仅用于查找所有列
重复)。结果是布尔值 Series 。类似的东西:
df.drop(~df.duplicated(subset="...", keep=False))