Question

我正在网上练习，它说：请计算人口超过25,000的加利福尼亚州（缩写CA）和纽约（NY）（合在一起）的城市平均人口数。

对于此问题，假设出现在多个州的城市名称代表两个不同的城市。

请注意：不同的州可能具有相同的城市名称。一个城市可能有多个邮政编码。

一份文件：

db.zips.findOne（）

{
        "_id" : "92278",
        "city" : "TWENTYNINE PALMS",
        "loc" : [
                -116.06041,
                34.237969
        ],
        "pop" : 11412,
        "state" : "CA"
}

我的查询：

db.zips.aggregate([{$group:{ _id: {state: "$state", city: "$city", zip: "$_id"
}, pop: {$sum: "$pop"}}},{$match:{pop:{"$gt":25000}, "_id.state": {$in: ["CA", "
NY"]}}}, {$group: {_id:0, avg: {$avg: "$pop"}}}])
{ "_id" : 0, "avg" : 41485.69565217391 }

但这不正确，我错过了什么？

Answer 1

我想说一个城市可以有不同的邮政编码，在您的查询中，您考虑的是不同城市的拉链不同的城市。

所以，我会从你的第一组删除zip部分：

db.zips.aggregate([
    {
        $group: { 
            _id: {state: "$state", city: "$city"}, 
            pop: {$sum: "$pop"}
        }
    },
    {
        $match:{
            pop:{"$gt":25000}, "_id.state": {$in: ["CA", "NY"]}
        }
    }, 
    {
        $group: {
            _id:0, 
            avg: {$avg: "$pop"}
        }
    }
])

Answer 2

您可以尝试以下代码来查找该州的平均人口。随你也可以找到其他相关信息比如哪个是最大或最小的城市，以及使用聚合器的同一查询中的人口如下。

db.zips.drop()

    db.zips.insert({
    "_id" : "1",
    "city" : "C1",
    "pop" : 100,
    "state" : "CA"
    })

    db.zips.insert({
    "_id" : "2",
    "city" : "C2",
    "pop" : 50,
    "state" : "CA"
    })

    db.zips.insert({
    "_id" : "3",
    "city" : "C3",
    "pop" : 500,
    "state" : "CA"
    })

    db.zips.insert({
    "_id" : "4",
    "city" : "C4",
    "pop" : 80,
    "state" : "CA"
    })

    db.zips.aggregate([{$group:{ _id: {state: "$state", city : "$city"}, pop: {$sum : "$pop"} }},
    { $sort: { pop: 1 } },
    { $group:
    {
    _id : "$_id.state",
    biggestCity:  { $last: "$_id.city" },
    biggestPop:   { $last: "$pop" },
    smallestCity: { $first: "$_id.city" },
    smallestPop:  { $first: "$pop" }
    }
    }

])

您可以在以下链接中找到所有信息。

http://docs.mongodb.org/manual/tutorial/aggregation-zip-code-data-set/

- $阿钦

mongodb查询以获得城市人口的平均值

2 个答案: