我有很多数据会进入分片群集。
应插入,索引和分片的顺序是什么?
最好
1)批量插入数据>碎片>索引
或
2)批量插入数据> index>碎片
或
3)碎片&gt; <批量插入数据>索引
答案 0 :(得分:0)
您绝对应该创建索引,然后在插入文档之前对您的集合进行分片。
在插入高写入吞吐量的数据之前,应考虑pre-spliting块范围。在大多数情况下,这也将加速分片之间的数据分发。另请查看chunk migration。
答案 1 :(得分:0)
如果您可以预先排序插入的数据,我会选择#3。 决定分片,然后并行加载文档。