Node.js WriteStream未知编码错误

时间:2013-03-05 17:07:32

标签: node.js encoding

我已经创建了一个解析NGinx日志的模块,现在我正在编写一个使用它的命令工具。我的问题是我允许解析整个目录,这在读取然后解析方面不是问题,因为我有一个池,可以读取和解析,但是,在命令行工具上,我允许现在以不同的格式重写日志,JSON, - 好吧我会切入追逐,我已经写了这个Writer对象,它将保留所有WriteStreams的引用(wstreams [readFilePath](我知道我正在使用readFilePath,这个只是查找的关键), 并且还有一个通过模块公开对象的所有读取流的全局引用Parser.rstreams [readFilePath]

// creating a writer to handle the data buffering from the parser's readstreams
writer = {
wstreams: {},
append: function(data, wfile, rfile){
    console.log(JSON.stringify(this.wstreams[rfile]));
    if(this.wstreams[rfile] 
        && (this.wstreams[rfile].write(data, wfile) == false) // <-- crashing here 
        && parser.rstreams[rfile]
        && parser.rstreams[rfile].pause){
            console.log('Pausing: ' + rfile);
            parser.rstreams[rfile].pause();
    }
},
addStream: function(wfile, rfile){
    var wstream = fs.createWriteStream(wfile, {'flags': 'w', 'encoding':'utf8', 'mode': '0666'});
    console.log("stream added: " + wfile + " r: " + rfile);
    this.wstreams[rfile] = wstream;
    this.wstreams[rfile].on('drain', function(){
        if(parser.rstreams[rfile]
            && parser.rstreams[rfile].readable 
            && parser.rstreams[rfile].resume){
                console.log('Drained: ' + rfile);
                parser.rstreams[rfile].resume();
        }
    });
  }
}

当一个writeStream试图写入数据时,它会抛出一个Unknown Encoding异常,因为它默认为utf8,所以没有任何意义,即使我传递了可选编码,它也会做同样的事情,我试过ut8, utf-8和ascii

{"path":"/Users/akhoury/code/rk/ginx/bin/here.json","fd":8,"writable":true,"flags":"w","encoding":"utf8","mode":"0666","bytesWritten":0,"busy":false,"_queue":[],"_events":{}}
[GINX][ERROR][uncaughtException] Error: Unknown encoding
[GINX-DEBUG] Exiting - 0 {file:cursor} record(s) stored in /Users/akhoury/code/rk/ginx/tmp/stored.cursors

/Users/akhoury/code/rk/ginx/lib/ginx.js:453
throw err;
      ^
Error: Unknown encoding
at Buffer.write (buffer.js:382:13)
at new Buffer (buffer.js:261:26)
at WriteStream.write (fs.js:1548:12)
at Object.writer.append (/Users/akhoury/code/rk/ginx/bin/ginx.js:95:38)
at /Users/akhoury/code/rk/ginx/bin/ginx.js:152:16
at Ginx.eval [as hardParseLine] (eval at generateParseLine (/Users/akhoury/code/rk/ginx/lib/ginx.js:59:21))
at streamData (/Users/akhoury/code/rk/ginx/lib/ginx.js:179:13)
at Ginx.parseFile.fs.stat.stream.on.streamEnd.cursor (/Users/akhoury/code/rk/ginx/lib/ginx.js:346:28)
at EventEmitter.emit (events.js:93:17)
at ReadStream._emitData (fs.js:1365:10)

我甚至JSON.stringify流以查看其中的内容,它看起来很好。

我查看了buffer.js的来源并且它没有意义,当编码不是允许列表时应该发生错误     https://github.com/joyent/node/blob/master/lib/buffer.js:50年代

然后我有一个循环,它将读取目录,如果是目录,然后是write.addStream(outputfile,inputfile)

if (stats.isDirectory()) {
fs.mkdir(output, function () {
    fs.readdir(input, function (err, files) {
        if (err) error(err);
        files.forEach(function (wfile) {
            wfile = path.join(output, file);
            rfile = path.join(input, file);
            console.log("W:"+ wfile + " R: " + rfile);
            //prepend the JSON openings for each new file before we go on.
            if (isNewFile(rfile)) {
                fs.writeFileSync(wfile, "{[", 'utf8');
            }
            writer.addStream(wfile, rfile); // <-- adding the stream to writer here
        });
        processDirectory(input, output);
    });
});
} else if (stats.isFile()) {
if (isNewFile(input)) {
    fs.writeFile(output, "{[", 'utf8', function () {
        writer.addStream(output, input);
        processFile(input, output);
    });
} else {
    writer.addStream(output, input);
    processFile(input, output);
  }
}

然后在processFile和processDirectory中,每次我收到一个rowCallback,这意味着一行已被解析,我使用writer.append

// process file parsing to JSON output
function processFile(input, ouput) {
parser.parseFile(input,

function (err, row) {
    if (err) error(err);
    writer.append(ifLastRow(row), output, row.__file);
},

function (err, rfile) {
    if (err) error(err);
    //close the JSON array
    writer.append("]}", output, file);
});

}

// process directory parsing to JSON outputs
function processDirectory(input, output) {
parser.parseDir(input,

function (err, row) {
    if (err) error(err);
    var fname = row.__fname;
    writer.append(ifLastRow(row), path.join(output, fname), row.__file);
},

function (err, rfile) {
    if (err) error(err);
    var wfile = path.join(output, rfile.substring(rfile.lastIndexOf(path.sep) + 1));
    //close the JSON array
    writer.append("]}", wfile, rfile);
},

function (err, filesCount) {
    if (err) error(err);
 });
}

谁能看到我在这里做错了什么? 我是以错误的方式创建流吗?

我知道要阅读很多,但我不想过于笼统。 谢谢。

1 个答案:

答案 0 :(得分:5)

问题是您将文件名作为第二个参数传递给stream.write(),但是.write()的第二个参数是可选编码(请参阅上一个链接)。

错误是因为它试图将文件名用作编码,即Unknown encoding。如果data是缓冲区,则让它根据缓冲区确定编码。

写入流与文件绑定,因此您不需要在每次写入时传递文件名。尝试更改:

    && (this.wstreams[rfile].write(data, wfile) == false)

要:

    && (this.wstreams[rfile].write(data) == false)