所以我知道我可以检查列是否唯一(is_unique)。但是,我想检查列的组合是否唯一。
例如:
| | a | b |
|---:|----:|----:|
| 0 | 1 | 2 |
| 1 | 2 | 2 |
| 2 | 3 | 4 |
| 3 | 1 | 5 |
列a和b不是唯一的。但是它们在一起。
是否可以快速检查一下。我有一个非常大的DataFrame(几百万行)。
我可以想到3种方法。一种是如果我使用drop_duplicates,然后检查是否删除了任何内容。第二个是使其成为索引并使用诸如MultiIndex.unique之类的东西。 我也可以将两列组合为字符串,然后使用is_unique进行检查。
这些方法似乎很慢。有没有一种快速的方法来做到这一点。
非常感谢