db.XYZ.update尝试更新并忽略重复键失败

时间:2012-04-11 14:29:30

标签: mongodb

我在尝试修复MongoDB中的某些对象时遇到了一些奇怪的行为。我正在尝试将语言代码(lc)从may更改为msa,并且我有一个关于文本和语言代码的唯一索引,例如{t:1, lc:1}

首先我得到了计数:

db.Unit.count({lc: "may"});

我试试:

db.Unit.find({lc: "may"}, {"t":1}).limit(1000).forEach(function(obj) {
    try {
         db.Unit.update({ _id: obj._id }, {$set : { "lc": "msa"}} );
         print('Changed :' + obj.t + '#' + obj._id);
    } catch (err) {
        print(err);
    }
});

这似乎可以打印出许多对象,然后失败:

E11000 duplicate key error index: jerome5.Unit.$t_1_lc_1  dup key: { : "laluan", : "msa" }

现在我预计失败之前的匹配会被正确更新,但计数会返回完全相同的数字。

我的Javascript错过了一些明显的东西吗?

更新:看起来打印出来的一些对象没有抛出异常也是重复的。因此看起来在抛出错误之前会有一些延迟(我启用了日记功能)。这是正常的行为吗?

1 个答案:

答案 0 :(得分:6)

简短的回答是问题在于JS代码。

默认情况下,Mongo中的更新会被激活并忘记,因此即使单个更新由于重复键而失败,“try”语句仍将成功完成,并且“catch”部分中的代码将永远不会被执行。可能看起来正在执行“catch”代码,因为当forEach循环结束时,JS shell返回db.getLastError(),如果操作成功,它将返回null。 GetLastError在此处的文档中进行了解释: http://www.mongodb.org/display/DOCS/getLastError+Command

这可能最好通过例子解释:

让我们创建一个简单的集合和一个独特的索引:

> db.unit.save({_id:0, lc: "may", t:0})
> db.unit.ensureIndex({t:1, lc:1}, {unique:true})
> for(var i=1; i<10; i++){db.unit.save({_id:i, lc: "may", t:i})}
> db.unit.find()
{ "_id" : 0, "lc" : "may", "t" : 0 }
{ "_id" : 1, "lc" : "may", "t" : 1 }
{ "_id" : 2, "lc" : "may", "t" : 2 }
{ "_id" : 3, "lc" : "may", "t" : 3 }
{ "_id" : 4, "lc" : "may", "t" : 4 }
{ "_id" : 5, "lc" : "may", "t" : 5 }
{ "_id" : 6, "lc" : "may", "t" : 6 }
{ "_id" : 7, "lc" : "may", "t" : 7 }
{ "_id" : 8, "lc" : "may", "t" : 8 }
{ "_id" : 9, "lc" : "may", "t" : 9 }
>

我们将运行一个脚本将所有“may”值更改为“msa”。在我们开始之前,让我们进行一些更改,因此将“may”的某些值更改为“msa”将在索引中创建重复值:

> db.unit.update({_id: 3}, {"lc" : "msa", "t" : 4 })
> db.unit.update({_id: 6}, {"lc" : "msa", "t" : 5 })
> db.unit.find()
{ "_id" : 0, "lc" : "may", "t" : 0 }
{ "_id" : 1, "lc" : "may", "t" : 1 }
{ "_id" : 2, "lc" : "may", "t" : 2 }
{ "_id" : 3, "lc" : "msa", "t" : 4 }
{ "_id" : 4, "lc" : "may", "t" : 4 }
{ "_id" : 5, "lc" : "may", "t" : 5 }
{ "_id" : 6, "lc" : "msa", "t" : 5 }
{ "_id" : 7, "lc" : "may", "t" : 7 }
{ "_id" : 8, "lc" : "may", "t" : 8 }
{ "_id" : 9, "lc" : "may", "t" : 9 }
> 

现在当我们的脚本命中文档_id:4和_id:5时,它将无法将“lc”的值更改为“may”,因为这样做会在索引中创建重复的条目。

让我们运行您的脚本版本。我添加了一些额外的行,使其更加冗长:

db.unit.find({lc: "may"}, {"t":1}).limit(1000).forEach(function(obj) {
    try {
        print("Found _id: " + obj._id );
        db.unit.update({ _id: obj._id }, {$set : { "lc": "msa"}} );
        if(db.getLastError() == null){
            print('Changed t :' + obj.t + ' _id : ' + obj._id);
        }
        else{
            print("Unable to change _id : " + obj.id + " because: " + db.getLastError())
        }
    } catch (err) {
        print("boo");
        print(err);
    }
});

Found _id: 0
Changed t :0 _id : 0
Found _id: 1
Changed t :1 _id : 1
Found _id: 2
Changed t :2 _id : 2
Found _id: 4
Unable to change _id : undefined because: E11000 duplicate key error index: test.unit.$t_1_lc_1  dup key: { : 4.0, : "msa" }
Found _id: 5
Unable to change _id : undefined because: E11000 duplicate key error index: test.unit.$t_1_lc_1  dup key: { : 5.0, : "msa" }
Found _id: 7
Changed t :7 _id : 7
Found _id: 8
Changed t :8 _id : 8
Found _id: 9
Changed t :9 _id : 9
> 

正如您所看到的,“boo”从未打印过,因为“catch”代码从未执行过,即使无法更新两个记录。从技术上讲,update()没有失败,因为索引条目重复而无法更改文档,并生成了一条消息。

所有可以更改的记录都已成功更改。

> db.unit.find()
{ "_id" : 0, "lc" : "msa", "t" : 0 }
{ "_id" : 1, "lc" : "msa", "t" : 1 }
{ "_id" : 2, "lc" : "msa", "t" : 2 }
{ "_id" : 3, "lc" : "msa", "t" : 4 }
{ "_id" : 4, "lc" : "may", "t" : 4 }
{ "_id" : 5, "lc" : "may", "t" : 5 }
{ "_id" : 6, "lc" : "msa", "t" : 5 }
{ "_id" : 7, "lc" : "msa", "t" : 7 }
{ "_id" : 8, "lc" : "msa", "t" : 8 }
{ "_id" : 9, "lc" : "msa", "t" : 9 }

如果再次运行脚本,则会生成以下输出:

Found _id: 4
Unable to change _id : undefined because: E11000 duplicate key error index: test.unit.$t_1_lc_1  dup key: { : 4.0, : "msa" }
Found _id: 5
Unable to change _id : undefined because: E11000 duplicate key error index: test.unit.$t_1_lc_1  dup key: { : 5.0, : "msa" }
E11000 duplicate key error index: test.unit.$t_1_lc_1  dup key: { : 5.0, : "msa" }
>

正如您所看到的,最后一条错误消息被打印了两次:一次是我们在脚本中打印出来的,一次是在脚本完成时打印出来的。

原谅这种反应的冗长性质。我希望这可以提高您对getLastError的理解以及如何在JS shell中执行操作。

可以在没有try / catch语句的情况下重写脚本,只需打印出无法更新的任何文档的_ids:

db.unit.find({lc: "may"}, {"t":1}).limit(1000).forEach(function(obj) {
    print("Found _id: " + obj._id );
    db.unit.update({ _id: obj._id }, {$set : { "lc": "msa"}} );
    if(db.getLastError() == null){
        print('Changed t :' + obj.t + ' _id : ' + obj._id);
    }
    else{
        print("Unable to change _id : " + obj.id + " because: " + db.getLastError())
    }
});