在MongoDB文档中过滤数组

时间:2017-11-21 01:30:43

标签: python mongodb pymongo

我正在尝试根据Twitter用户提及创建网络地图。我将数据存储在MongoDB中,无法弄清楚如何删除不需要的用户。

db文档示例:

{
  'user': 'user1'
  'mentioned_users: ['user2', 'user3']
}
{
  'user': 'user2'
  'mentioned_users: ['user1', 'user3']
}

示例所需输出:

{
  'user': 'user1'
  'mentioned_users': ['user2']
}
{
  'user': 'user2'
  'mentioned_users': ['user1']
}

user3存在于提及的用户的user1和user2列表中,但是user3是无关紧要的,因为user3在集合中没有自己的文档。

我需要使用db.collection.find()或其他方法的过滤器,以便我可以摆脱所有无关的用户。

用pymongo有一个简单的方法吗,或者我应该创建一个python解决方案?

1 个答案:

答案 0 :(得分:1)

您可以在MongoDB查询中使用aggregate。可以尝试这个

db.users.aggregate([
  {$unwind: "$mentioned_users"},
  {$lookup: {from: "users", localField: "mentioned_users", foreignField: "user", as: "validUser"}},
  {$match: {"validUser.user": {$exists: true}}},
  {
    $group: {
      _id: "$_id",
      user: {$first: "$user"},
      mentioned_users: {$push: "$mentioned_users"}
    }
  }
])

然后输出就像

{
  "_id" : ObjectId("5a13bc87400096bfa0b34228"),
  "user" : "user1",
  "mentioned_users" : ["user2"]
}
{
  "_id" : ObjectId("5a13bc87400096bfa0b34229"),
  "user" : "user2",
  "mentioned_users" : ["user1"]
}