我正在网上练习,它说: 请计算人口超过25,000的加利福尼亚州(缩写CA)和纽约(NY)(合在一起)的城市平均人口数。
对于此问题,假设出现在多个州的城市名称代表两个不同的城市。
请注意: 不同的州可能具有相同的城市名称。 一个城市可能有多个邮政编码。
一份文件:
db.zips.findOne()
{
"_id" : "92278",
"city" : "TWENTYNINE PALMS",
"loc" : [
-116.06041,
34.237969
],
"pop" : 11412,
"state" : "CA"
}
我的查询:
db.zips.aggregate([{$group:{ _id: {state: "$state", city: "$city", zip: "$_id"
}, pop: {$sum: "$pop"}}},{$match:{pop:{"$gt":25000}, "_id.state": {$in: ["CA", "
NY"]}}}, {$group: {_id:0, avg: {$avg: "$pop"}}}])
{ "_id" : 0, "avg" : 41485.69565217391 }
但这不正确,我错过了什么?
答案 0 :(得分:1)
我想说一个城市可以有不同的邮政编码,在您的查询中,您考虑的是不同城市的拉链不同的城市。
所以,我会从你的第一组删除zip部分:
db.zips.aggregate([
{
$group: {
_id: {state: "$state", city: "$city"},
pop: {$sum: "$pop"}
}
},
{
$match:{
pop:{"$gt":25000}, "_id.state": {$in: ["CA", "NY"]}
}
},
{
$group: {
_id:0,
avg: {$avg: "$pop"}
}
}
])
答案 1 :(得分:1)
您可以尝试以下代码来查找该州的平均人口。随你也可以找到其他相关信息 比如哪个是最大或最小的城市,以及使用聚合器的同一查询中的人口如下。
db.zips.drop()
db.zips.insert({
"_id" : "1",
"city" : "C1",
"pop" : 100,
"state" : "CA"
})
db.zips.insert({
"_id" : "2",
"city" : "C2",
"pop" : 50,
"state" : "CA"
})
db.zips.insert({
"_id" : "3",
"city" : "C3",
"pop" : 500,
"state" : "CA"
})
db.zips.insert({
"_id" : "4",
"city" : "C4",
"pop" : 80,
"state" : "CA"
})
db.zips.aggregate([{$group:{ _id: {state: "$state", city : "$city"}, pop: {$sum : "$pop"} }},
{ $sort: { pop: 1 } },
{ $group:
{
_id : "$_id.state",
biggestCity: { $last: "$_id.city" },
biggestPop: { $last: "$pop" },
smallestCity: { $first: "$_id.city" },
smallestPop: { $first: "$pop" }
}
}
])
您可以在以下链接中找到所有信息。
http://docs.mongodb.org/manual/tutorial/aggregation-zip-code-data-set/
- $阿钦