检查多个数据框列是否唯一

时间:2020-04-15 11:49:58

标签: python pandas rows

所以我知道我可以检查列是否唯一(is_unique)。但是,我想检查列的组合是否唯一。

例如: | | a | b | |---:|----:|----:| | 0 | 1 | 2 | | 1 | 2 | 2 | | 2 | 3 | 4 | | 3 | 1 | 5 | 列a和b不是唯一的。但是它们在一起。

是否可以快速检查一下。我有一个非常大的DataFrame(几百万行)。

我可以想到3种方法。一种是如果我使用drop_duplicates,然后检查是否删除了任何内容。第二个是使其成为索引并使用诸如MultiIndex.unique之类的东西。 我也可以将两列组合为字符串,然后使用is_unique进行检查。

这些方法似乎很慢。有没有一种快速的方法来做到这一点。

非常感谢

0 个答案:

没有答案