在MongoDB中,是否可以使用其他字段中的值更新字段的值?等效的SQL类似于:
UPDATE Person SET Name = FirstName + ' ' + LastName
MongoDB伪代码将是:
db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );
答案 0 :(得分:232)
你应该迭代。对于您的具体情况:
db.person.find().snapshot().forEach(
function (elem) {
db.person.update(
{
_id: elem._id
},
{
$set: {
name: elem.firstname + ' ' + elem.lastname
}
}
);
}
);
答案 1 :(得分:144)
执行此操作的最佳方法是使用聚合框架来计算新字段。
最有效的解决方案是在版本4.2中使用3.4+中的$set
或$addFields
以及$out
聚合管道运算符。
我将在此处显示$addFields
,因为$set
是$addFields
的别名
db.collection.aggregate(
[
{ "$addFields": {
"name": { "$concat": [ "$firstName", " ", "$lastName" ] }
}},
{ "$out": "collection" }
]
)
请注意,此不会更新您的收藏,而是替换现有收藏或创建新收藏。此外,对于需要“类型转换”的更新操作,您需要进行客户端处理, ,根据操作的不同,您可能需要使用find()
方法而不是.aggreate()
方法。
我们这样做的方法是$project
我们的文档并使用$concat
字符串聚合运算符来返回连接字符串。
我们从那里开始迭代游标并使用$set
更新运算符使用批量操作将新字段添加到您的文档中,以实现最高效率。
var cursor = db.collection.aggregate([
{ "$project": {
"name": { "$concat": [ "$firstName", " ", "$lastName" ] }
}}
])
由此,您需要使用bulkWrite
方法。
var requests = [];
cursor.forEach(document => {
requests.push( {
'updateOne': {
'filter': { '_id': document._id },
'update': { '$set': { 'name': document.name } }
}
});
if (requests.length === 500) {
//Execute per 500 operations and re-init
db.collection.bulkWrite(requests);
requests = [];
}
});
if(requests.length > 0) {
db.collection.bulkWrite(requests);
}
在此版本中,您需要使用现已弃用的Bulk
API及其associated methods。
var bulk = db.collection.initializeUnorderedBulkOp();
var count = 0;
cursor.snapshot().forEach(function(document) {
bulk.find({ '_id': document._id }).updateOne( {
'$set': { 'name': document.name }
});
count++;
if(count%500 === 0) {
// Excecute per 500 operations and re-init
bulk.execute();
bulk = db.collection.initializeUnorderedBulkOp();
}
})
// clean up queues
if(count > 0) {
bulk.execute();
}
cursor["result"].forEach(function(document) {
db.collection.update(
{ "_id": document._id },
{ "$set": { "name": document.name } }
);
})
答案 2 :(得分:103)
显然,自MongoDB 3.4以来,有一种方法可以有效地完成这项工作,请参阅styvane's answer。
下面的过时答案
您无法在更新中引用文档本身。您需要遍历文档并使用函数更新每个文档。有关示例,请参阅this answer,服务器端eval()
请参见this one。
答案 3 :(得分:41)
对于活动量较大的数据库,您可能会遇到更新影响主动更改记录的问题,因此我建议使用 snapshot()
db.person.find().snapshot().forEach( function (hombre) {
hombre.name = hombre.firstName + ' ' + hombre.lastName;
db.person.save(hombre);
});
http://docs.mongodb.org/manual/reference/method/cursor.snapshot/
答案 4 :(得分:9)
我尝试了上述解决方案,但我发现它不适合大量数据。然后我发现了流功能:
MongoClient.connect("...", function(err, db){
var c = db.collection('yourCollection');
var s = c.find({/* your query */}).stream();
s.on('data', function(doc){
c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
});
s.on('end', function(){
// stream can end before all your updates do if you have a lot
})
})
答案 5 :(得分:3)
关于此answer,根据此update,快照功能在版本3.6中已弃用。因此,在3.6及更高版本上,可以通过以下方式执行操作:
db.person.find().forEach(
function (elem) {
db.person.update(
{
_id: elem._id
},
{
$set: {
name: elem.firstname + ' ' + elem.lastname
}
}
);
}
);
答案 6 :(得分:2)
这里是我们想出的将一个字段复制到另一个字段~150_000条记录的内容。花了大约6分钟,但仍然比实例化和迭代相同数量的ruby对象的资源密集程度要小得多。
js_query = %({
$or : [
{
'settings.mobile_notifications' : { $exists : false },
'settings.mobile_admin_notifications' : { $exists : false }
}
]
})
js_for_each = %(function(user) {
if (!user.settings.hasOwnProperty('mobile_notifications')) {
user.settings.mobile_notifications = user.settings.email_notifications;
}
if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
}
db.users.save(user);
})
js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
Mongoid::Sessions.default.command('$eval' => js)
答案 7 :(得分:1)
使用 MongoDB 4.2+版,更新更加灵活,因为它允许在其update
,updateOne
和updateMany
中使用聚合管道。现在,您可以使用聚合运算符来转换文档,然后进行更新,而无需显式声明$set
命令(而是使用$replaceRoot: {newRoot: "$$ROOT"}
)
在这里,我们使用聚合查询从MongoDB的ObjectID“ _id”字段中提取时间戳并更新文档(我不是SQL方面的专家,但我认为SQL不提供任何自动生成的带有时间戳的ObjectID,您将必须自动创建该日期)
var collection = "person"
agg_query = [
{
"$addFields" : {
"_last_updated" : {
"$toDate" : "$_id"
}
}
},
{
$replaceRoot: {
newRoot: "$$ROOT"
}
}
]
db.getCollection(collection).updateMany({}, agg_query, {upsert: true})
答案 8 :(得分:0)
以Mongo 4.2
,db.collection.update()
开始可以接受聚合管道,最终允许基于另一个字段来更新/创建一个字段:
// { firstName: "Hello", lastName: "World" }
db.collection.update(
{},
[{ $set: { name: { $concat: [ "$firstName", " ", "$lastName" ] } } }],
{ multi: true }
)
// { "firstName" : "Hello", "lastName" : "World", "name" : "Hello World" }
第一部分{}
是匹配查询,用于过滤要更新的文档(在本例中为所有文档)。
第二部分[{ $set: { name: { ... } }]
是更新聚合管道(请注意方括号表示使用聚合管道)。 $set
是新的聚合运算符,并且是$addFields
的别名。
不要忘记{ multi: true }
,否则只会更新第一个匹配的文档。
答案 9 :(得分:0)
(我本来可以将其发布为评论,但不能)
对于任何试图使用c#驱动程序在文档中使用另一个字段来更新一个字段的人来说...
我不知道如何使用任何UpdateXXX
方法及其相关的重载,因为它们将UpdateDefinition
作为参数。
// we want to set Prop1 to Prop2
class Foo { public string Prop1 { get; set; } public string Prop2 { get; set;} }
void Test()
{
var update = new UpdateDefinitionBuilder<Foo>();
update.Set(x => x.Prop1, <new value; no way to get a hold of the object that I can find>)
}
作为一种解决方法,我发现您可以在RunCommand
(https://docs.mongodb.com/manual/reference/command/update/#dbcmd.update)上使用IMongoDatabase
方法。
var command = new BsonDocument
{
{ "update", "CollectionToUpdate" },
{ "updates", new BsonArray
{
new BsonDocument
{
// Any filter; here the check is if Prop1 does not exist
{ "q", new BsonDocument{ ["Prop1"] = new BsonDocument("$exists", false) }},
// set it to the value of Prop2
{ "u", new BsonArray { new BsonDocument { ["$set"] = new BsonDocument("Prop1", "$Prop2") }}},
{ "multi", true }
}
}
}
};
database.RunCommand<BsonDocument>(command);
答案 10 :(得分:0)
update()
方法将聚合管道作为参数,如
db.collection_name.update(
{
// Query
},
[
// Aggregation pipeline
{ "$set": { "id": "$_id" } }
],
{
// Options
"multi": true // false when a single doc has to be updated
}
)
可以使用聚合管道使用现有值设置或取消设置字段。
注意:使用$
和字段名来指定要读取的字段。