如何在不事先知道列数的情况下加载csv文件

时间:2015-01-12 23:32:54

标签: arrays csv d3.js

这是我尝试做的事情: 我想通过条形图可视化患有某些疾病的人的所有排列。 例如。我有所有组合患有某些疾病的人数。让我们说如果有3种疾病,我有7组人数。对于4种疾病,有15种可能的人群,对于n种疾病,有2 ^ n-1种组合。

此数据的合适csv文件结构是:

frequency,disease1,disease2,disease3,disease4
40,1,0,0,0
36,1,0,1,0
25,0,1,0,0
37,0,0,0,1
20,0,0,1,1
5,1,1,1,1

第2行意味着40人患有疾病,但没有其他人。第3行意味着36人患有疾病1和疾病3。

好吧,在查看了如何从csv文件中读取的示例之后,我没有找到这个文件结构的答案(我不知道预先包含了多少列)。

此示例的初始条形图应显示4个条形图,每个疾病对应一个条形图 - 高度为发生此疾病的所有计数(具有值1)。 然后在选择一个条形后,我计划更新该子集的剩余条形图(尚未实现 - 但数据结构应该有效地支持它)。

有些人可以给我一个提示,如何加载初始数据结构(来自未知数量的属性)?

我将当前版本添加到我在第89行认识的地方

.attr("x", function(d) { return x("disease1"); })

我无法动态访问列名。我目前的想法是最好为值创建一个数组数组,为属性名创建一个单独的数组。但是我还没弄清楚,因为从属性中填充数组会与任意顺序发生冲突,因为其中的数据会出现在'中。循环迭代。 替代方案,其中每个值由

表示
{key: 'column name 1'; value: value}
由于冗余的数量,

似乎是禁止的。

我当前的版本:

<!DOCTYPE html>
<meta charset="utf-8">
<style>

.bar {
  fill: steelblue;
}

.bar:hover {
  fill: brown;
}

.axis {
  font: 10px sans-serif;
}

.axis path,
.axis line {
  fill: none;
  stroke: #000;
  shape-rendering: crispEdges;
}

.x.axis path {
  display: none;
}

</style>
<body>
<script src="http://d3js.org/d3.v3.min.js"></script>
<script>

var margin = {top: 20, right: 20, bottom: 30, left: 40},
    width = 960 - margin.left - margin.right,
    height = 500 - margin.top - margin.bottom;

var permutations;

var x = d3.scale.ordinal()
    .rangeRoundBands([0, width], .1);

var y = d3.scale.linear()
    .range([height, 0]);

var xAxis = d3.svg.axis()
    .scale(x)
    .orient("bottom");

var yAxis = d3.svg.axis()
    .scale(y)
    .orient("left")
    // .ticks(10, "%");

var svg = d3.select("body").append("svg")
    .attr("width", width + margin.left + margin.right)
    .attr("height", height + margin.top + margin.bottom)
  .append("g")
    .attr("transform", "translate(" + margin.left + "," + margin.top + ")");

d3.csv("diseases.csv", type, function(error, data) {
      permutations = data;
      var products = d3.keys(permutations[0]).filter(function(key) {
        return key != "frequency";});

  // debugger;
  x.domain(products);
  y.domain([0, d3.max(data, function(d) { return d.frequency; })]);


  svg.append("g")
      .attr("class", "x axis")
      .attr("transform", "translate(0," + height + ")")
      .call(xAxis);

  svg.append("g")
      .attr("class", "y axis")
      .call(yAxis)
    .append("text")
      .attr("transform", "rotate(-90)")
      .attr("y", 6)
      .attr("dy", ".71em")
      .style("text-anchor", "end")
      .text("Frequency");

  svg.selectAll(".bar")
      .data(data)
    .enter().append("rect")
      .attr("class", "bar")
      .attr("x", function(d) { return x("disease1"); })
      .attr("width", x.rangeBand())
      .attr("y", function(d) { return y(d.frequency); })
      .attr("height", function(d) { return height - y(d.frequency); });

});

function type(d) {
    for (var perm in d) {
        if (Object.prototype.hasOwnProperty.call(d, perm)) {
            console.log("before: " + d[perm]);
            d[perm] = +d[perm];
            console.log("after: "+ d[perm]);
        }
    }    
    // d.frequency = +d.frequency;
  return d;
}

</script>

1 个答案:

答案 0 :(得分:0)

我的理解是,您希望对每种疾病的频率(第一列)求和,并使用这些频率创建条形图。您可以更改处理从CSV文件加载的数据的方式:

d3.csv("diseases.csv", type, function(error, permutations) {
    var diseases = d3.keys(permutations[0]).filter(function(key) { return key != "frequency";}),
        data = diseases.map(function(d){ return {disease: d, frequency: 0}});
    permutations.forEach(function(row){
        diseases.forEach(function(d, i){
            if (row[d] === 1){
                data[i].frequency += row["frequency"];
            }
        })
    })

data存储在如下所示的数组中:

[{"disease":"disease1","frequency":81},{"disease":"disease2","frequency":30},
 {"disease":"disease3","frequency":61},{"disease":"disease4","frequency":62}]

然后只需修改x域:

x.domain(diseases);
绘制x以使用特定疾病时

<rect>属性:

    .attr("x", function(d) { return x(d.disease); })

进行这些更改会给我以下条形图:

enter image description here