Mongodb:在组后的聚合中使用记录计数

时间:2018-01-16 19:53:05

标签: mongodb aggregation-framework

我试图存储输入到管道的记录总数,以便我可以在以后的计算中使用该数字。如何获取输入数量,然后展开,然后在我的计算中使用输入数量?

我可以通过这样做得到这个数字:

db.articles.aggregate([
  {
    $count: "totalArticles"
  }
]}

我可以通过这样做获得我想要的其他数据:

db.articles.aggregate([
  {
    $unwind: "$concepts"
  },
  {
    $group: {
      _id:    "$concepts.text",
      count: {
        $sum: 1
      },
      average: {
        $avg: "$concepts.relevance"
      },
    }
  }
])

我真正想做的是:

db.articles.aggregate([
  {
    $count: "totalArticles"
  },
  {
    $unwind: "$concepts"
  },
  {
    $group: {
      _id:    "$concepts.text",
      count: {
        $sum: 1
      },
      average: {
        $avg: "$concepts.relevance"
      }
    }
  },
  {
    $project: {
      count: "$count",
      percent: {
        $divide: [ "$count", "$totalArticles" ]
      }
    }
  },
  {
    $sort: {
      count: -1
    }
  }
])

1 个答案:

答案 0 :(得分:2)

您可以使用以下聚合查询。

初始$group计算总数,而$push概念字段为数组字段。 $$ROOT访问整个文档。

保留下一个$group中的文章总数。

按照你的方式休息。

db.articles.aggregate([
  {"$group":{
    "_id":null,
    "totalArticles":{"$sum":1},
    "concepts":{"$push":"$$ROOT.concepts"}
  }},
  {"$unwind":"$concepts"},
  {"$group":{
    "_id":"$concepts.text",
    "totalArticles":{"$first":"$totalArticles"},
    "count":{"$sum":1},
    "average":{"$avg":"$concepts.relevance"}
  }},
  {"$project":{
      "count": "$count",
      "percent": {
        "$divide": [ "$count", "$totalArticles" ]
      }
    }
  },
  {"$sort": {"count": -1}}
])

$facets也是一个选项,您可以在两个单独的管道中进行两个查询,然后合并以继续其余阶段。