数据库/集合任意但具体的顺序

时间:2012-01-29 07:38:21

标签: mongodb collections database

我想创建一个具有特定顺序的数据库(我正在使用mongodb)集合,该集合也可以重新排列。例如,如果我有

[A,B,C,D,E]

我可以将E移动到第三个位置,顺序将是

[A,B,E,C,D]

我想尽可能少地更改对象,因此在每个对象上放置一个索引是行不通的(因为我需要为简单的移动更改所有后续元素的索引)。

我还可以像链接列表一样创建对象,因此每个对象都具有前一个和下一个对象的id。示例更改将如下所示。

["A":{prev:null, next:"B"},
"B":{prev:"A", next:"C"},
"C":{prev:"B", next:"D"},
"D":{prev:"C", next:"E"},
"E":{prev:"D", next:null}]

会改为

["A":{prev:null, next:"B"},
"B":{prev:"A", next:"E"},
"C":{prev:"E", next:"D"},
"D":{prev:"C", next:null},
"E":{prev:"B", next:"C"}]

对于任何大小的集合,这最多可以更改5个对象。更改可以表示为一个更新的对象,并使用一些逻辑来确定需要更新的其他对象。这是可行的,但我想知道是否有比这更好的方法。是否有更简单的方法来跟踪任意列表的顺序?

1 个答案:

答案 0 :(得分:2)

好的,您的链接列表方式比多重更新方法快得多,可扩展性更高,但收集大小为500,每次“移动”大约需要7毫秒(使用我的基准代码 - 显然不同大小的集合可能会有所作为)。此外,如果您希望能够在服务器上订购集合,那么使用“order”值进行索引/排序将使其变得更加容易。随着集合大小的增加,多重更新方法相应地平均增加,这是有道理的,因为它大致为O(n)。无论大小如何,你的方法在每次移动0.8ms时保持相当一致,这也是有意义的,因为它是O(1)。

这是我的两个测试的填充代码,它说明了简单的架构设计/索引配置:

var populateMulti = function(colSize) {
   db.test10.drop();
   for(var i=0;i<colSize;i++) {
      db.test10.save({name:""+i, order:i});
   }  
   db.test10.ensureIndex({order:1});
}

var populateLinked = function(colSize) {
   db.test10.drop();
   db.test10.save({name: ""+0, prev:null, next:""+1});
   for(var i=1;i<colSize-1;i++) {
      db.test10.save({name:""+i, prev:""+(i-1), next:""+(i+1)});
   }  
   db.test10.save({name: ""+(colSize-1), prev:""+(i-1), next:null});
   db.test10.ensureIndex({name:1});
}

这是我的两个移动代码。对于潜在的5次更新你是对的 - 我没有想到这一切。

var moveMulti = function(oldPos,newPos) {
   if(oldPos == newPos) return;
   db.test10.update({order:oldPos}, 
                    {$set:{order:newPos, hold:true}}, 
                    false, false);
   if(oldPos < newPos) {
      db.test10.update({order:{$gt:oldPos, $lte:newPos}, hold:{$exists:false}},
                       {$inc:{order:-1}}, 
                       false, true);
   } else if(newPos < oldPos) {
      db.test10.update({order:{$gte:newPos, $lt:oldPos}, hold:{$exists:false}},
                       {$inc:{order:1}}, 
                       false, true);
   }
   db.test10.update({order:newPos}, 
                    {$unset:{hold:1}}, 
                    false, false);
}

var moveLinked = function(oldPos,newPos) {
   var toMove = db.test10.findOne({name:""+oldPos});
   var dest = db.test10.findOne({name:""+newPos});
   if(toMove.prev != null) {
      db.test10.update({name: toMove.prev}, {$set:{next:toMove.next}}, false, false);
   }
   if(toMove.next != null) {
      db.test10.update({name: toMove.next}, {$set:{prev:toMove.prev}}, false, false);
   }
   if(dest.prev != null) {
      db.test10.update({name: dest.prev}, {$set:{next:toMove.name}}, false, false);
   }
   db.test10.update({name: toMove.name}, {$set:{prev:dest.prev, next:dest.name}}, false, false);
   db.test10.update({name: dest.name}, {$set:{prev:toMove.name}}, false, false);
}

我将省略基准代码。如果你想自己运行它,请在这里看到整个事情: https://gist.github.com/1700270

以下是我笔记本电脑上的搜索结果:

coll size: 10; finished 5000 moves with multi-update in: 1188ms; 0.2376ms per move
coll size: 10; finished 5000 moves with linked in: 3593ms; 0.7186ms per move
coll size: 100; finished 5000 moves with multi-update in: 7545ms; 1.509ms per move
coll size: 100; finished 5000 moves with linked in: 3800ms; 0.76ms per move
coll size: 500; finished 5000 moves with multi-update in: 37754ms; 7.5508ms per move
coll size: 500; finished 5000 moves with linked in: 4027ms; 0.8054ms per move
coll size: 1000; finished 5000 moves with multi-update in: 71609ms; 14.3218ms per move
coll size: 1000; finished 5000 moves with linked in: 4221ms; 0.8442ms per move
coll size: 10000; finished 5000 moves with multi-update in: 676043ms; 135.2086ms per move
coll size: 10000; finished 5000 moves with linked in: 4041ms; 0.8082ms per move