crossfilter - 计算具有属性的所有记录的百分比

时间:2015-02-06 09:27:50

标签: d3.js dc.js crossfilter

这是我的问题:

我正在使用一个从mongo db获取json数据的python flask服务器,并在那里我指定要导入的字段。这个数据是json格式,并且只是这样获取。一旦通过graphs.js中的crossfilter,是否可以对这些字段进行转换?例如我有一个状态属性,可以采取值"通过","进行中","保持"或"失败"。我基本上想做一个告诉我百分比失败的指标。理想情况下,我必须对数据进行一些计算。请告知此事。

Sample data (in tabular form for clarity) looks like:
TrialLocation     | Subject Status
Site A            | In progress
Site A            | Pass
Site B            | In progress
Site A            | In progress
Site B            | On Hold
Site A            | Screen Failure

在这种情况下,我应该在x轴和y轴上得到一个带有站点名称的条形图,我应该得到计算失败百分比的指标。在这种情况下将是 A站点为25%,站点B为0%。

所以我首先创建了图表,它给了我每个站点的主题数。

var siteName = ndx.dimension(function(d) { return d["TrialLocation"];});
var numSubjectsBySite = siteName.group();
var siteLevelChart = dc.barChart("#site-level-count", "subjectView");

最后是图表:

siteLevelChart
 .width(2000)
 .height(200)
 .transitionDuration(1000)
 .dimension(siteName)
 .group(numSubjectsBySite)
 .ordering(function(d){return d.value;})

所以我想,我会用SubjectStatus ="屏幕失败"来计算行数。并将其除以总行数,在这种情况下将是" numSubjectsBySite"变量 然后当我介绍这段代码时:

var countScreenFailures = ndx.dimension(function(d){ return d["SubjectStatus"];});
 countScreenFailures.filter("Off Study");

我的条形图仅显示主题状态=" ScreenFailure"的行。

如何计算屏幕故障率然后使用它?请帮帮我?

非常感谢你。 Anmol

2 个答案:

答案 0 :(得分:4)

您需要构建自定义分组/缩减功能,以跟踪每个状态的计数以及总计数。然后你可以在图表中划分来计算你的百分比。如果您对使用Reductio感兴趣,可以执行以下操作:

var reducer = reductio().count(true);

// Do this as many times as you need for different status counts. Each
// call of reducer.value will add a new property to your groups where
// you can store the count for that status.
reducer.value("ScreenFailure").sum(
  function(d) {
    // This counts records with SubjectStatus = "Screen Failure"
    return d["SubjectStatus"] === "Screen Failure" ? 1 : 0;
  });

// Build the group with the Reductio reducers.
var numSubjectsBySite = reducer(siteName.group());

// In your dc.js chart, calculate the % using a value accessor.
siteLevelChart
 .width(2000)
 .height(200)
 .transitionDuration(1000)
 .dimension(siteName)
 .group(numSubjectsBySite)
 .valueAccessor(function(p) { return p.value.ScreenFailure.sum / p.value.count; })
 .ordering(function(d){return d.value;})

答案 1 :(得分:3)

您可以使用自定义groupAll。这是一个直接的crossfilter解决方案,基于您在后面的问题中提供的jsfiddle。

(使用小提琴回答要容易得多!)

var all = ndx.groupAll();
var failurePercentGroup = all.reduce(
    function(p, v) {
        ++p.count;
        p.failures += (v.Status === 'Screen Failure' ? 1 : 0);
        p.failPercent = p.count ? p.failures/p.count : 0;
        return p;
    },
    function(p, v) {
        --p.count;
        p.failures -= (v.Status === 'Screen Failure' ? 1 : 0);
        p.failPercent = p.count ? p.failures/p.count : 0;
        return p;
    },
    function() {
        return {
            count: 0,
            failures: 0,
            failPercent: 0
        };
    }
);

failurePercent.valueAccessor(function (x) {
    return x.failPercent;
})
    .group(failurePercentGroup);

@ Ethan的回答看起来应该有效,但是你在别处说过你无法让它发挥作用。

此处更新了小提琴:http://jsfiddle.net/gordonwoodhull/vct0dzou/8/

我没有把它格式化为百分比,所以它只显示一个比例,但你应该能够计算出那个部分。