高级数据聚合:计算MongoDB集合中的平均值

时间:2011-06-06 19:19:39

标签: mongodb node.js

我有一系列文件,如:

{
"browser" : "firefox",
"version" : "4.0.1"
}

{
"browser" : "firefox",
"version" : "3.6.2"
}

{
"browser" : "ie",
"version" : "8.0"
}

如何统计所有浏览器的平均值,结果如下:

global firefox: 66%
global ie: 33%

precise firefox:
4.0.1: 50%
3.6.3: 50%

棘手的部分是我不想提供阵列中可用的所有Firefox版本。 MongoDB查询应该查找集合中的所有不同版本并计算所有这些版本的平均值。

提前致谢!

1 个答案:

答案 0 :(得分:6)

这是一个使用纯数字生成统计数据的解决方案(例如0.5而不是50%):

var m = function() {
  emit('global', this.browser);
  emit('local', [this.browser, this.version]);
};

var r = function(key, values) {
  var global={}, local={}, total=0, i, j, x;
  if (key == 'global') {
    values.forEach(function(v) {
      global[v] = (global[v]||0) + 1;
      total += 1;
    });
    for (i in global) { global[i] = global[i] / total; }
    return global;
  } else if (key == 'local') {
    values.forEach(function(v) {
      if (!local[v[0]]) { local[v[0]] = {}; }
      x = local[v[0]];
      x[v[1]] = (x[v[1]]||0) + 1;
    });
    for (i in local) {
      total = 0;
      x = local[i];
      for (j in x) { total += x[j]; }
      for (j in x) { x[j] = x[j] / total; }
    }
    return local;
  };
};

db.browsers.mapReduce(m, r, {out:'bout'});
db.bout.find();
// => { "_id" : "global", "value" : { "firefox" : 0.6666666666666666, "ie" : 0.3333333333333333 } }
// => { "_id" : "local", "value" : { "firefox" : { "4.0.1" : 0.5, "3.6.2" : 0.5 }, "ie" : { "8.0" : 1 } } }