使用Python在包含数百万个条目的csv文件中查找重复项的有效方法是什么?

时间:2019-01-26 02:40:00

标签: python database algorithm sqlite

我有一个包含一百万行的csv文件。我想使用python的sqlite库将其转换为sql样式数据库。该表必须具有某些列作为主键,但是该列包含一些重复项,因此我需要删除具有重复项的列。现在,我建立了一个集合,并每次都占用O(n)和O(n)空间进行查找,那么从时间和空间复杂度方面,还有没有更有效的方法可以从数百万个条目中找到重复的列?

0 个答案:

没有答案