我在尝试修复MongoDB中的某些对象时遇到了一些奇怪的行为。我正在尝试将语言代码(lc
)从may
更改为msa
,并且我有一个关于文本和语言代码的唯一索引,例如{t:1, lc:1}
首先我得到了计数:
db.Unit.count({lc: "may"});
我试试:
db.Unit.find({lc: "may"}, {"t":1}).limit(1000).forEach(function(obj) {
try {
db.Unit.update({ _id: obj._id }, {$set : { "lc": "msa"}} );
print('Changed :' + obj.t + '#' + obj._id);
} catch (err) {
print(err);
}
});
这似乎可以打印出许多对象,然后失败:
E11000 duplicate key error index: jerome5.Unit.$t_1_lc_1 dup key: { : "laluan", : "msa" }
现在我预计失败之前的匹配会被正确更新,但计数会返回完全相同的数字。
我的Javascript错过了一些明显的东西吗?
更新:看起来打印出来的一些对象没有抛出异常也是重复的。因此看起来在抛出错误之前会有一些延迟(我启用了日记功能)。这是正常的行为吗?
答案 0 :(得分:6)
简短的回答是问题在于JS代码。
默认情况下,Mongo中的更新会被激活并忘记,因此即使单个更新由于重复键而失败,“try”语句仍将成功完成,并且“catch”部分中的代码将永远不会被执行。可能看起来正在执行“catch”代码,因为当forEach循环结束时,JS shell返回db.getLastError(),如果操作成功,它将返回null。 GetLastError在此处的文档中进行了解释: http://www.mongodb.org/display/DOCS/getLastError+Command
这可能最好通过例子解释:
让我们创建一个简单的集合和一个独特的索引:
> db.unit.save({_id:0, lc: "may", t:0})
> db.unit.ensureIndex({t:1, lc:1}, {unique:true})
> for(var i=1; i<10; i++){db.unit.save({_id:i, lc: "may", t:i})}
> db.unit.find()
{ "_id" : 0, "lc" : "may", "t" : 0 }
{ "_id" : 1, "lc" : "may", "t" : 1 }
{ "_id" : 2, "lc" : "may", "t" : 2 }
{ "_id" : 3, "lc" : "may", "t" : 3 }
{ "_id" : 4, "lc" : "may", "t" : 4 }
{ "_id" : 5, "lc" : "may", "t" : 5 }
{ "_id" : 6, "lc" : "may", "t" : 6 }
{ "_id" : 7, "lc" : "may", "t" : 7 }
{ "_id" : 8, "lc" : "may", "t" : 8 }
{ "_id" : 9, "lc" : "may", "t" : 9 }
>
我们将运行一个脚本将所有“may”值更改为“msa”。在我们开始之前,让我们进行一些更改,因此将“may”的某些值更改为“msa”将在索引中创建重复值:
> db.unit.update({_id: 3}, {"lc" : "msa", "t" : 4 })
> db.unit.update({_id: 6}, {"lc" : "msa", "t" : 5 })
> db.unit.find()
{ "_id" : 0, "lc" : "may", "t" : 0 }
{ "_id" : 1, "lc" : "may", "t" : 1 }
{ "_id" : 2, "lc" : "may", "t" : 2 }
{ "_id" : 3, "lc" : "msa", "t" : 4 }
{ "_id" : 4, "lc" : "may", "t" : 4 }
{ "_id" : 5, "lc" : "may", "t" : 5 }
{ "_id" : 6, "lc" : "msa", "t" : 5 }
{ "_id" : 7, "lc" : "may", "t" : 7 }
{ "_id" : 8, "lc" : "may", "t" : 8 }
{ "_id" : 9, "lc" : "may", "t" : 9 }
>
现在当我们的脚本命中文档_id:4和_id:5时,它将无法将“lc”的值更改为“may”,因为这样做会在索引中创建重复的条目。
让我们运行您的脚本版本。我添加了一些额外的行,使其更加冗长:
db.unit.find({lc: "may"}, {"t":1}).limit(1000).forEach(function(obj) {
try {
print("Found _id: " + obj._id );
db.unit.update({ _id: obj._id }, {$set : { "lc": "msa"}} );
if(db.getLastError() == null){
print('Changed t :' + obj.t + ' _id : ' + obj._id);
}
else{
print("Unable to change _id : " + obj.id + " because: " + db.getLastError())
}
} catch (err) {
print("boo");
print(err);
}
});
Found _id: 0
Changed t :0 _id : 0
Found _id: 1
Changed t :1 _id : 1
Found _id: 2
Changed t :2 _id : 2
Found _id: 4
Unable to change _id : undefined because: E11000 duplicate key error index: test.unit.$t_1_lc_1 dup key: { : 4.0, : "msa" }
Found _id: 5
Unable to change _id : undefined because: E11000 duplicate key error index: test.unit.$t_1_lc_1 dup key: { : 5.0, : "msa" }
Found _id: 7
Changed t :7 _id : 7
Found _id: 8
Changed t :8 _id : 8
Found _id: 9
Changed t :9 _id : 9
>
正如您所看到的,“boo”从未打印过,因为“catch”代码从未执行过,即使无法更新两个记录。从技术上讲,update()没有失败,因为索引条目重复而无法更改文档,并生成了一条消息。
所有可以更改的记录都已成功更改。
> db.unit.find()
{ "_id" : 0, "lc" : "msa", "t" : 0 }
{ "_id" : 1, "lc" : "msa", "t" : 1 }
{ "_id" : 2, "lc" : "msa", "t" : 2 }
{ "_id" : 3, "lc" : "msa", "t" : 4 }
{ "_id" : 4, "lc" : "may", "t" : 4 }
{ "_id" : 5, "lc" : "may", "t" : 5 }
{ "_id" : 6, "lc" : "msa", "t" : 5 }
{ "_id" : 7, "lc" : "msa", "t" : 7 }
{ "_id" : 8, "lc" : "msa", "t" : 8 }
{ "_id" : 9, "lc" : "msa", "t" : 9 }
如果再次运行脚本,则会生成以下输出:
Found _id: 4
Unable to change _id : undefined because: E11000 duplicate key error index: test.unit.$t_1_lc_1 dup key: { : 4.0, : "msa" }
Found _id: 5
Unable to change _id : undefined because: E11000 duplicate key error index: test.unit.$t_1_lc_1 dup key: { : 5.0, : "msa" }
E11000 duplicate key error index: test.unit.$t_1_lc_1 dup key: { : 5.0, : "msa" }
>
正如您所看到的,最后一条错误消息被打印了两次:一次是我们在脚本中打印出来的,一次是在脚本完成时打印出来的。
原谅这种反应的冗长性质。我希望这可以提高您对getLastError的理解以及如何在JS shell中执行操作。
可以在没有try / catch语句的情况下重写脚本,只需打印出无法更新的任何文档的_ids:
db.unit.find({lc: "may"}, {"t":1}).limit(1000).forEach(function(obj) {
print("Found _id: " + obj._id );
db.unit.update({ _id: obj._id }, {$set : { "lc": "msa"}} );
if(db.getLastError() == null){
print('Changed t :' + obj.t + ' _id : ' + obj._id);
}
else{
print("Unable to change _id : " + obj.id + " because: " + db.getLastError())
}
});