dc.js箱形图精简器(使用两组)

时间:2018-08-01 17:31:24

标签: javascript d3.js dc.js

我正在尝试绘制一个箱形图,以显示按其供应商分组的单个设备已连接的网络总数。

数据格式:

{
    "SSID": "eduroam",
    "identifier": "Client",
    "latitude": 52.4505,
    "longitude": -1.9361,
    "mac": "dc:d9:16:##:##:##",
    "packet": "PR-REQ",
    "timestamp": "2018-07-10 12:25:26",
    "vendor": "Huawei Technologies Co.Ltd"
}

摆弄数据 https://jsfiddle.net/v4a8g2bo/

使用以下代码,我设法获得了单个设备已连接的网络总数。之前经过过滤的数据仅包含mac地址的唯一网络,因此使用计数器可以对网络进行计数。

var mac = ndx.dimension(function (d) { return d["mac"]; });
var SSIDstoSingleMAC = mac.group().reduceSum(function (d) { return 
+d.counter});

我的问题出在试图将该分组总和传递到另一个组时,该输出组将输出一个数组以用于箱形图

var vendor = ndx.dimension(function (d) { return d["vendor"]; });

//Used to count number of networks per device
var mac = ndx.dimension(function (d) { return d["mac"]; });
var SSIDstoSingleMAC = mac.group().reduceSum(function (d) { return 
+d.counter});

//This is where things fall down
var boxplotGroup = SSIDstoSingleMAC.group().reduce(
    function (p, v) {
        let dv = v.counter;
        if (dv != null) p.push(dv);
        return p;
    },
    function (p, v) {
        let dv = v.counter;
        if (dv != null) p.splice(p.indexOf(dv), 1);
        return p;
    },
    function () {
        return [];
    }
);

var boxPlot = dc.boxPlot("#boxPlot");
boxPlot
    .width(1200)
    .height(600)
    .dimension(vendor)
    .group(boxplotGroup)
    .tickFormat(d3.format('.1f'))
    .elasticY(true)
    .elasticX(true)
;

这是目标: 例如苹果[7,5,10,2] =四个苹果设备..设备一已连接到7个网络...等 The Goal

隐藏组的尝试

戈登在评论中提到,不能在交叉过滤器中递归传递两个组。我现在正在尝试产生一个隐藏的组,该组可以使用DC git中的以下代码来积累每个mac地址的网络,但是我无法将其与boxplot减速器结合起来。我在这里朝正确的方向前进吗? ?

https://github.com/dc-js/dc.js/wiki/FAQ#accumulate-values

var allDim = ndx.dimension(function (d) { return d; });

function accumulate_group(source_group) {
    return {
        all:function () {
            var cumulate = 0;
            return source_group.all().map(function(d) {
                cumulate += d.counter;
                return {key:d.mac, value:cumulate};
            });
        }
    };
}

var boxPlotDim = accumulate_group(allDim);

var boxPlotGroup = boxPlotDim.group().reduce(
    function(p,v) {
        p.push(v.value());
        return p;
    },
    function(p,v) {
        p.splice(p.indexOf(v.value()), 1);
        return p;
    },
    function() {
        return [];
    }
);

var boxPlot = dc.boxPlot("#boxPlot");
boxPlot
    .width(1200)
    .height(600)
    .dimension(vendor)
    .group(boxPlotGroup)
    .tickFormat(d3.format('.1f'))
    .elasticY(true)
    .elasticX(true)
;

感谢亚当

1 个答案:

答案 0 :(得分:2)

理想情况下,我们非常想在此处对供应商使用一个简单的尺寸,以防我们想在箱图中使用画笔进行过滤。

因此,问题就变成了:我们如何减少两次,一次获取每个MAC地址的计数,然后再次将这些计数转换为数组。

第一部分有一个标准的答案:只是简化为对象而不是值:

var vendorMacCountsGroup = vendor.group().reduce(
  function(p, v) { // add
    p[v.mac] = (p[v.mac] || 0) + v.counter;
    return p;
  },
  function(p, v) { // remove
    p[v.mac] -= v.counter;
    return p;
  },
  function() { // init
    return {}; // macs;
  }
);

我最近描述了这种模式in this answer,因此在此不再赘述。

以下是示例输出:bin是供应商,每个值都是一个将mac地址映射为计数的对象:

[
  {
    "key": "Asustek Computer Inc.",
    "value": {
      "1c:b7:2c:48": 8,
      "1c:b7:be:ef": 3
    }
  },
  {
    "key": "Huawei Technologies Co.Ltd",
    "value": {
      "dc:d9:16:3d": 14,
      "dc:da:16:3d": 2,
      "dc:d9:16:3a": 1,
      "dc:d9:16:3b": 1
    }
  },
  ...

接下来,我们真的只想要计数,而忘记了MAC地址。 JavaScript为此提供了一个不错的内置函数Object.values。我们只需要将其应用于我们组中的每个对象值。我们还将抛出任何零,因为只有在MAC地址已在其他位置被过滤掉时,这种情况才会发生。

function flatten_object_group(group) {
  return {
    all: function() {
      return group.all().map(function(kv) {
        return {
          key: kv.key,
          value: Object.values(kv.value).filter(function(v) { return v>0; })
        }; 
      });
    }
  };
}
var boxPlotGroup = flatten_object_group(vendorMacCountsGroup);

示例输出:

[
  {
    "key": "Asustek Computer Inc.",
    "value": [
      8,
      3
    ]
  },
  {
    "key": "Huawei Technologies Co.Ltd",
    "value": [
      14,
      2,
      1,
      1
    ]
  },
  ...

您的样本数据每个供应商只有一个MAC地址,因此我添加了一些虚假数据,并得到了一个看起来不错的箱形图:

it's a boxplot

Fork of your fiddle

仅以#MAC排名前十名

作为一个示例,说明如何在框太多的情况下修剪数据,以下是如何按MAC地址数量排序并仅接受10个“最受欢迎”供应商的方法:

function top_ten_by_length(group) {
  return {
    all: function() {
      return group.all().sort(function(a,b) {
        return b.value.length - a.value.length;
      }).slice(0, 10);
    }
  };
}

像这样组成它们:

var boxPlotGroup = top_ten_by_length(flatten_object_group(vendorMacCountsGroup));

这是我的头顶,未经测试,因此如果有故障,请编辑/评论。