我有一个包含1730个文档的JSON文件。我运行导入 与
D:\Apps\Mongo\Install\bin>mongoimport --db test --collection test --file MongoExport.json
它说导入了1730文档,但是当我对我的测试集合运行计数时,我只有1000个文档。我还没找到任何可以帮助我的东西
谢谢:)
答案 0 :(得分:-1)
好的,我找到了解决方案,尽管我知道并不是最优雅的解决方案。由于我导出的数据集中的每个记录都有其自己唯一的to_ignore = ['Jack']
(np.where(df['Name'].isin(to_ignore), '', df.groupby('Name').cumcount().map(nth))
+ df['Name'])
0 firstTom
1 secondTom
2 Jack
3 firstTerry
Name: Name, dtype: object
值,因此我知道没有重复记录的机会,因此我再次通过导入器运行了相同的json文件。第二遍看起来更长(因为现在必须确定是对每个记录进行更新还是插入),但是每个记录都成功了!如果它在第二遍过后错过了一些时间,我本来可以进行第三遍,但是两遍就可以容纳130,000多个记录。
注意:摆弄_id
对我没有任何帮助。