我正在尝试根据Twitter用户提及创建网络地图。我将数据存储在MongoDB中,无法弄清楚如何删除不需要的用户。
db文档示例:
{
'user': 'user1'
'mentioned_users: ['user2', 'user3']
}
{
'user': 'user2'
'mentioned_users: ['user1', 'user3']
}
示例所需输出:
{
'user': 'user1'
'mentioned_users': ['user2']
}
{
'user': 'user2'
'mentioned_users': ['user1']
}
user3存在于提及的用户的user1和user2列表中,但是user3是无关紧要的,因为user3在集合中没有自己的文档。
我需要使用db.collection.find()或其他方法的过滤器,以便我可以摆脱所有无关的用户。
用pymongo有一个简单的方法吗,或者我应该创建一个python解决方案?
答案 0 :(得分:1)
您可以在MongoDB查询中使用aggregate
。可以尝试这个
db.users.aggregate([
{$unwind: "$mentioned_users"},
{$lookup: {from: "users", localField: "mentioned_users", foreignField: "user", as: "validUser"}},
{$match: {"validUser.user": {$exists: true}}},
{
$group: {
_id: "$_id",
user: {$first: "$user"},
mentioned_users: {$push: "$mentioned_users"}
}
}
])
然后输出就像
{
"_id" : ObjectId("5a13bc87400096bfa0b34228"),
"user" : "user1",
"mentioned_users" : ["user2"]
}
{
"_id" : ObjectId("5a13bc87400096bfa0b34229"),
"user" : "user2",
"mentioned_users" : ["user1"]
}