MongoDB由数组内部元素组成

时间:2014-02-02 09:33:58

标签: mongodb mongodb-query aggregation-framework

我有一个文章列表,每个文章都有一个数组属性,列出了其中提到的各个人:

_id: {
    $oid: "52b632a9e4f2ba13c82ccd23"
},
providerName: "The Guardian",
url: "http://feeds.theguardian.com/c/34708/f/663860/s/3516cebc/sc/38/l/0L0Stheguardian0N0Cmusic0C20A130Cdec0C220Cwaterboys0Efishermans0Eblues0Etour0Ehammersmith/story01.htm",
subject: "The Waterboys – review",
class_artist: [
    "paul mccartney"
]

我一直在尝试(未成功)获取所有个别艺术家(class_artist)的列表,根据他们在过去7天内被标记的文章数量。

我已经达到了:

var date = new Date();
date.setDate(date.getDate() - 7);

db.articles.group({
    key: { class_artist: 1 },
    cond: { class_date: { $gt: date } },
    reduce: function ( curr, result ) { result.cnt++; },
    initial: { cnt : 0 }
}).sort({cnt: -1});

但不幸的是,它不会根据单个数组值计算它们,而是通过数组合成(即艺术家列表)来计算它们。

我尝试使用$unwind功能,但无法使其正常工作。

1 个答案:

答案 0 :(得分:106)

您使用的是哪种框架?这不是MongoDB shell,看起来像MapReduce周围的一些奇怪的包装器。在这种情况下,$unwind将无法使用,您需要aggregation framework中的用户使用它。这就是你想要的mongo shell:

db.articles.aggregate([
  {$match: { class_date: { $gte: date } } },
  {$project: { _id: 0, class_artist: 1 } },
  {$unwind: "$class_artist" },
  {$group: { _id: "$class_artist", tags: { $sum: 1 } }},
  {$project: { _id: 0,class_artist: "$_id", tags: 1 } },
  {$sort: { tags: -1 } }
])

如此高效:

  1. Filter按日期,因为您已经为过去7天设置了一个var
  2. Project只有我们需要的字段{我们只需要一个! }
  3. Unwind数组,所以我们现在为每个文档中的每个数组元素都有一条记录
  4. 来自扩展文档的艺术家
  5. Group
  6. 将项目转换为文档格式,您可以将其用作与_id
  7. 混淆的组
  8. Sort结果以相反的顺序查看标记为首的
  9. 关于聚合的好处是你可以逐步建立这些阶段来看看发生了什么。

    根据需要摇动并烘焙到您自己的驱动程序实现或ODM框架中。