d3.csv修改输入数据

时间:2016-06-30 19:48:20

标签: javascript d3.js accessor

我正在使用d3.tsv来解析文件。我想将数据的一列中的所有零(PValue列)更改为该列中的下一个最小数字。我相信这样做的正确方法是使用访问器功能,但到目前为止我的尝试都失败了。

d3.tsv(filename, modifyData, function(error, data) {

    data.forEach(function(d) {
        d.NAME = d.NAME;
        d.logFC = +d.logFC;
        d.logCPM = +d.logCPM;
        d.FDR = +d.FDR;
        d.PValue = +d.PValue
    });
})

当我尝试在访问器函数modifyData中执行类似以下操作时,我收到一条错误消息“数据'在上面的代码中未定义。

function modifyData(d){
    d.forEach(function(origData){
        origData.PValue = +origData.PValue
        pValue_array.push(origData.PValue)
    })
    var pValue_array = [] 
    for (var i = pValue_array.length-1 ; i >= 0; i--){
        if (pValue_array[i] === 0){
            pValue_array.splice(i,1);
        }
    }
    var newPzero = (arrayMin(pValue_array))
    return d;
};

arrayMin是一个返回数组中最小值的简单函数。我打算使用这个值来替换PValue列中的所有0。非常感谢帮助!

2 个答案:

答案 0 :(得分:1)

您可以先找到最小值,然后替换0:

d3.tsv('data.tsv', function(error, data) {

//Option A
// smallest = d3.min(data, function(d) {return +d.PValue || Infinity; })

//Option B
var noZeroes = data.filter(function(d) { return +d.Data !== 0; });
var smallest = d3.min(noZeroes, function(d) { return d.Data; })


    data.forEach(function(d) {

        d.NAME = d.NAME;
        d.logFC = +d.logFC;
        d.logCPM = +d.logCPM;
        d.FDR = +d.FDR;

        if (+d.PValue == 0 ) {
          d.Data = +smallest;
        } else {
          d.PValue = +d.PValue 
        }
    });

console.table(data);
})

不要忘记数字值的“+”,否则JS认为它是字符串,你的比较会失败.-

答案 1 :(得分:0)

您可以使用d3.min从数据集中获取最小值。

例如

d3.tsv(filename, function(error, data) {
    data.forEach(function(d) {
        d.NAME = d.NAME;
        d.logFC = +d.logFC;
        d.logCPM = +d.logCPM;
        d.FDR = +d.FDR;

        d.PValue = +(d.PValue || d3.min(data, function(d) { return d.PValue || Infinity; }));
    });
})