crossfilter中的reduceAdd,reduceSum,reduceRemove函数是什么?它们应该如何使用?

时间:2013-05-27 06:08:53

标签: javascript crossfilter

有人可以用简单的术语解释如何使用reduceAddreduceSumreduceRemove来减少函数在crossfilter中的作用吗?

2 个答案:

答案 0 :(得分:54)

请记住,map reduce会按特定维度的键减少数据集。例如,让我们使用带有记录的crossfilter实例:

[
    { name: "Gates",      age: 57,   worth: 72000000000, gender: "m" },
    { name: "Buffet",     age: 59,   worth: 58000000000, gender: "m" },
    { name: "Winfrey",    age: 83,   worth:  2900000000, gender: "f"   },
    { name: "Bloomberg",  age: 71,   worth: 31000000000, gender: "m"  },
    { name: "Walton",     age: 64,   worth: 33000000000, gender: "f"  },
]

和尺寸名称,年龄,价值和性别。我们将使用reduce方法减少性别维度。

首先我们定义reduceAdd,reduceRemove和reduceInitial回调方法。

reduceInitial返回一个具有缩小对象和初始值形式的对象。它不需要参数。

function reduceInitial() {
    return {
        worth: 0,
        count: 0
    };
}

reduceAdd定义当记录被“过滤”为特定键的简化对象时会发生什么。第一个参数是简化对象的瞬态实例。第二个对象是当前记录。该方法将返回增强的瞬态缩减对象。

function reduceAdd(p, v) {
    p.worth = p.worth + v.worth;
    p.count = p.count + 1;
    return p;
}

reduceRemovereduceAdd相反(至少在此示例中)。它采用与reduceAdd相同的参数。这是必需的,因为在过滤记录时会更新组缩减,有时需要从先前计算的组缩减中删除记录。

function reduceRemove(p, v) {
    p.worth = p.worth - v.worth;
    p.count = p.count - 1;
    return p;
}

调用reduce方法如下所示:

mycf.dimensions.gender.reduce(reduceAdd, reduceRemove, reduceInitial)

要查看减少的值,请使用all方法。要查看前n个值,请使用top(n)方法。

mycf.dimensions.gender.reduce(reduceAdd, reduceRemove, reduceInitial).all()

返回的数组将(应该)如下所示:

[
    { key: "m", value: { worth: 161000000000, count: 3 } },
    { key: "f", value: { worth:  35000000000, count: 2 } },
]

减少数据集的目标是通过首先按公共密钥对记录进行分组,然后将这些分组的维度减少为每个密钥的单个值来派生新数据集。在这种情况下,我们按性别分组,并通过添加共享相同密钥的记录值来减少该分组的价值维度。

其他reduceX方法是reduce方法的便捷方法。

对于此示例,reduceSum将是最合适的替代。

mycf.dimensions.gender.reduceSum(function(d) {
    return d.worth;
});

在返回的分组上调用all将(应该)看起来像:

[
    { key: "m", value: 161000000000 },
    { key: "f", value: 35000000000 },
]

reduceCount会计算记录

mycf.dimensions.gender.reduceCount();

在返回的分组上调用all将(应该)看起来像:

[
    { key: "m", value: 3 },
    { key: "f", value: 2 },
]

希望这会有所帮助:)

来源:https://github.com/square/crossfilter/wiki/API-Reference

答案 1 :(得分:6)

http://blog.rusty.io/2012/09/17/crossfilter-tutorial/

var livingThings = crossfilter([
  // Fact data.
  { name: “Rusty”,  type: “human”, legs: 2 },
  { name: “Alex”,   type: “human”, legs: 2 },
  { name: “Lassie”, type: “dog”,   legs: 4 },
  { name: “Spot”,   type: “dog”,   legs: 4 },
  { name: “Polly”,  type: “bird”,  legs: 2 },
  { name: “Fiona”,  type: “plant”, legs: 0 }
]);

例如,我家里有多少生物?

为此,我们将调用groupAll便利功能,该功能选择全部 记录到一个组,然后是reduceCount函数,其中 创建记录计数。

// How many living things are in my house?
var n = livingThings.groupAll().reduceCount().value();
console.log("There are " + n + " living things in my house.") // 6

现在让我们算一下我家里所有的腿。同样,我们将使用groupAll函数来获取单个组中的所有记录,但之后我们将其称为 reduceSum功能。这将把价值加在一起。有什么价值? 好吧,我们想要腿,所以让我们传递一个函数来提取并返回事实中的腿数。

// How many total legs are in my house?
var legs = livingThings.groupAll().reduceSum(function(fact) {
  return fact.legs;
}).value()
console.log("There are " + legs + " legs in my house.")

reduceCount函数创建记录计数 reduceSum函数是这些记录的总和值。