在将文本文件原始导入MongoDB后删除重复记录的最佳方法是什么?

时间:2018-01-27 20:16:18

标签: mongodb

我导入了很多记录,需要能够删除可能导入错误的重复项。

enter image description here

另外,我希望能够查询特定关键字的所有记录。我是MongoDB的新手,希望有人可以帮助解决一两个问题。

1 个答案:

答案 0 :(得分:0)

为了删除基于key的重复项,您可以在集合上创建index并启用此dropDups

db.yourCollection.ensureIndex({'myKey' : 1}, {unique : true, dropDups : true})

以下index将保留第一个唯一文档,然后删除所有重复文件。

注意:dropDups在MongoDB 3.0或更高版本中不起作用。如果您是新版本,请改为使用此解决方案here

对于特定关键字的查询记录,您可以同时使用find(带或不带正则表达式)和MongoDB text search

您可以在MongoDB 查找 here文字搜索 here上找到更多相关信息。