使用转换流解析文本文件时,节点js错误

时间:2015-07-26 15:27:07

标签: javascript node.js parsing stream

我需要解析Node js服务器上的文本文件。文本文件由标题和项目列表组成,所有这些都在不同的行上。我做了一个请求,然后我将响应传递给解析器流。我需要从标题中提取时间。问题是有时头变量会从文件中间附加一些信息。如果我在console.log它,它看起来像这样:

HEADER
MIDDLE_OF_THE_FILE_STUFF

最奇怪的是,它始终没有发生。只是有时。并且文件填充的中间每次都附加在文件中的相同位置。我尝试了header.substring(0,len),但它只删除标题本身,而不是MIDDLE_OF_THE_FILE_STUFF。

以下是代码:

parser._transform = function(chunk,encoding,done){
    var time = {};
    var data = chunk.toString();
    lines = data.split('\n');

    header = (lines[0]);

    var regEx = /[0-9][0-9]:[0-9][0-9]/;

    var m = regEx.exec(header);
    var splitTime = m[0].split(':');
    time = {
        hours:splitTime[0],
        minutes:splitTime[1]
    }
    console.log(time);
    var pushjson = JSON.stringify(time, null, 2);
    this.push(pushjson);
    done();


}

request
    .get('url')
    .on('error', function(err){
        console.log(err)
    })
    .pipe(parser)
    .pipe(fs.createWriteStream('result.json')) 

我已经在这方面苦苦挣扎了一段时间,我无法在任何地方找到同样错误的帖子。我想我可能不明白transofrm流是如何完全运作的。所以,请帮忙。

1 个答案:

答案 0 :(得分:1)

您可以使用NPM拆分模块逐行解析流,我在流中使用此模块。继承了整个代码。

var stream = require('stream');
var parser = new stream.Transform({
objectMode: true
});
var request = require('request');
var split = require('split');
var fs = require('fs');

var currLine = 1;
var header;

parser._transform = function(line, encoding, done) {
    var time = {};
    if (currLine === 1) {
        header = line;
        console.log(header);
        var regEx = /[0-9][0-9]:[0-9][0-9]/;

        var m = regEx.exec(header);
        var splitTime = m[0].split(':');
        time = {
            hours: splitTime[0],
            minutes: splitTime[1]
        };
        console.log(time);
        var pushjson = JSON.stringify(time, null, 2);
        this.push(pushjson);
    }
    currLine++;
    done();
};

request
    .get('http://maps.weather.gov.hk/r4/input_files/latestReadings_AWS1')
    .on('error', function(err) {
        console.log(err);
    }).
pipe(split()).pipe(parser)
    .pipe(fs.createWriteStream('result.json'));