如何根据MongoDB中的两个相关输入变量编写查询以获取值?

时间:2015-05-21 03:05:34

标签: json node.js mongodb mongodb-query pymongo

我有一个mongoDB集合,其中包含以下格式的JSON文档。这只是一个样本,而不是完整的文档。

{
    "_id": ObjectId("555ba8a6ae96b63b98969192"),
    "toptags": {
        "@attr": {
            "artist": "Rihanna"
        },
        "tag": [
            {
                "count": "100",
                "name": "pop",
                "url": "http://www.last.fm/tag/pop"
            },
            {
                "count": "89",
                "name": "rnb",
                "url": "http://www.last.fm/tag/rnb"
            },
            {
                "count": "60",
                "name": "female vocalists",
                "url": "http://www.last.fm/tag/female%20vocalists"
            },
            {
                "count": "55",
                "name": "dance",
                "url": "http://www.last.fm/tag/dance"
            },
            {
                "count": "40",
                "name": "Hip-Hop",
                "url": "http://www.last.fm/tag/hip-hop"
            },
            {
                "count": "21",
                "name": "Rihanna",
                "url": "http://www.last.fm/tag/rihanna"
            },
      ]
      }
}

我在集合中有数百个类似的文档。我想写一个查询,它将返回具有给定标签集的“艺术家”名称,并且这些标签的“计数”值大于给定值。

这是我到目前为止尝试的两个查询

  1. collection_name.find({'$and': [{"toptags.tag.name":tag_array},
                                   {"toptags.tag.count":{'$gte':count_value}}]},
                         {"_id":"1","toptags.@attr.artist":"1"})
    
  2. collection_name.find({"toptags.artist":
                            {$all : [{"$elemMatch" : 
                                        {"name":tag_array, 
                                         "count": {'$gt': count_value}}},]})
    
  3. 以上查询均无效。我意识到第一个是根本错误的,因为它不会将作为参数传递的标签的“计数”值。 但我认为第二个应该有效。但我认为我的语法错了。 我哪里错了?

1 个答案:

答案 0 :(得分:1)

据我所知:

  • 您有一系列要匹配的标签;
  • 您只考虑超过特定阈值的标签。

正如@yogesh在评论中所建议的,您应首先确保您的标签计数是一个数字。不是字符串。完成后,您必须根据标记列表构建查询。 喜欢的东西可能是:

> THRESHOLD=50
> TAGS=['dance', 'rnb']
> for (idx in TAGS) {
    QTAGS[idx]={"$elemMatch": {"name":TAGS[idx], "count":{"$gt": THRESHOLD}}}
  }
> QTAGS
[
    {
        "$elemMatch" : {
            "name" : "dance",
            "count" : {
                "$gt" : 50
            }
        }
    },
    {
        "$elemMatch" : {
            "name" : "rnb",
            "count" : {
                "$gt" : 50
            }
        }
    }
]

现在,您可以查询您的数据库:

> db.w.find({"toptags.tag": { "$all": QTAGS}})
{ "_id" : ObjectId("555ba8a6ae96b63b98969192"), "toptags" : { "@attr" : { "artist" : "Rihanna" }, "tag" : [ { "count" : 100, "name" : "pop", "url" : "http://www.last.fm/tag/pop" }, { "count" : 89, "name" : "rnb", "url" : "http://www.last.fm/tag/rnb" }, { "count" : 60, "name" : "female vocalists", "url" : "http://www.last.fm/tag/female%20vocalists" }, { "count" : 55, "name" : "dance", "url" : "http://www.last.fm/tag/dance" }, { "count" : 40, "name" : "Hip-Hop", "url" : "http://www.last.fm/tag/hip-hop" }, { "count" : 21, "name" : "Rihanna", "url" : "http://www.last.fm/tag/rihanna" } ] } }

提高门槛再做一次,最后你不会选择任何东西:

> THRESHOLD=100
> for (idx in TAGS) {   QTAGS[idx]={"$elemMatch": {"name":TAGS[idx], "count":{"$gt": THRESHOLD}}} }
> db.w.find({"toptags.tag": { "$all": QTAGS}})
> // nothing