D3.csv修改输入数据

d3.csv modifying the input data

本文关键字:数据 输入 修改 csv D3      更新时间:2023-09-26

我使用d3。TSV解析文件。我想将数据的一列(PValue列)中的所有零更改为该列中下一个最小的数字。我认为正确的方法是使用accessor函数,但我的尝试到目前为止都失败了。

d3.tsv(filename, modifyData, function(error, data) {
    data.forEach(function(d) {
        d.NAME = d.NAME;
        d.logFC = +d.logFC;
        d.logCPM = +d.logCPM;
        d.FDR = +d.FDR;
        d.PValue = +d.PValue
    });
})

当我尝试在accessor函数modifyData中执行以下操作时,我得到一个错误,说'data'在上面的代码中未定义。

function modifyData(d){
    d.forEach(function(origData){
        origData.PValue = +origData.PValue
        pValue_array.push(origData.PValue)
    })
    var pValue_array = [] 
    for (var i = pValue_array.length-1 ; i >= 0; i--){
        if (pValue_array[i] === 0){
            pValue_array.splice(i,1);
        }
    }
    var newPzero = (arrayMin(pValue_array))
    return d;
};

arrayMin是一个返回数组中最小值的简单函数。我计划使用这个值来替换PValue列中的所有0。非常感谢您的帮助!

您可以先找到最小值,然后替换0:

d3.tsv('data.tsv', function(error, data) {
//Option A
// smallest = d3.min(data, function(d) {return +d.PValue || Infinity; })
//Option B
var noZeroes = data.filter(function(d) { return +d.Data !== 0; });
var smallest = d3.min(noZeroes, function(d) { return d.Data; })

    data.forEach(function(d) {
        d.NAME = d.NAME;
        d.logFC = +d.logFC;
        d.logCPM = +d.logCPM;
        d.FDR = +d.FDR;
        if (+d.PValue == 0 ) {
          d.Data = +smallest;
        } else {
          d.PValue = +d.PValue 
        }
    });
console.table(data);
})

不要忘记数字值的"+",否则JS将其视为字符串,并且您的比较将失败。

您可以使用d3。Min从数据集中得到最小值。

例如

d3.tsv(filename, function(error, data) {
    data.forEach(function(d) {
        d.NAME = d.NAME;
        d.logFC = +d.logFC;
        d.logCPM = +d.logCPM;
        d.FDR = +d.FDR;
        d.PValue = +(d.PValue || d3.min(data, function(d) { return d.PValue || Infinity; }));
    });
})