如何选择BSON文件的第一行

时间:2017-01-27 11:49:41

标签: mongodb file extract bson

我在Linux服务器上有一个巨大的BSON文件(100GB),我想在 MongoDB 中导入。 为了测试输入,我想创建一个包含BSON文件的1000个第一行/元组的文件。

你知道如何将1000条第一行提取到另一个BSON文件中吗?

谢谢!

1 个答案:

答案 0 :(得分:0)

我意识到上述评论无法解决您提出的问题。

如果你真的想雕刻“前1000”,我可能仍然会通过mongo折腾它

dd if=/path/to/your/file.bson of=/path/to/your/small.bson bs=1M count=20

导入20Meg文件,希望其中包含1000多个文档(如果不增加dd大小)。

获取第1000个对象ID

db.col.find({},{_id:1}).sort({_id:-1}).skip(999).limit(1)

将为您提供稍后使用的对象ID。

然后使用mongodump命令准确导出1000个文档

REF:https://docs.mongodb.com/manual/reference/program/mongodump/

mongodump --db YOUR_DB --collection YOUR_COL --query '{_id:{$lte:ObjectId("THE_ID_FROM_LAST_STEP")}}'