Question

我一直在尝试使用可读和转换流来处理非常大的文件。我似乎遇到的问题是，如果我不在最后放一个可写流，程序似乎在结果返回之前终止。

示例：rstream.pipe(split()).pipe(tstream)

我的tstream有一个发射器，当计数器达到阈值时会发出。当该阈值设置为较低的数字时，我得到一个结果，但是当它达到高时，它不会返回任何结果。如果我将它传递给文件编写器，它总是返回一个结果。我错过了一些明显的东西吗？

代码：

// Dependencies
var fs = require('fs');
var rstream = fs.createReadStream('file');
var wstream = fs.createWriteStream('output');
var split = require('split'); // used for separating stream by new line
var QTransformStream = require('./transform');

var qtransformstream = new QTransformStream();
qtransformstream.on('completed', function(result) {
    console.log('Result: ' + result);
});
exports.getQ = function getQ(filename, callback) {

    // THIS WORKS if i have a low counter for qtransformstream, 
    // but when it's high, I do not get a result
    //   rstream.pipe(split()).pipe(qtransformstream);

    // this always works
    rstream.pipe(split()).pipe(qtransformstream).pipe(wstream);

};

以下是Qtransformstream

的代码

// Dependencies
var Transform = require('stream').Transform,
    util = require('util');
// Constructor, takes in the Quser as an input
var TransformStream = function(Quser) {
    // Create this as a Transform Stream
    Transform.call(this, {
        objectMode: true
    });
    // Default the Qbase to 32 as an assumption
    this.Qbase = 32;
    if (Quser) {
        this.Quser = Quser;
    } else {
        this.Quser = 20;
    }
    this.Qpass = this.Quser + this.Qbase;
    this.Counter = 0;
    // Variables used as intermediates
    this.Qmin = 120;
    this.Qmax = 0;
};
// Extend the transform object
util.inherits(TransformStream, Transform);
// The Transformation to get the Qbase and Qpass
TransformStream.prototype._transform = function(chunk, encoding, callback) {
    var Qmin = this.Qmin;
    var Qmax = this.Qmax;
    var Qbase = this.Qbase;
    var Quser = this.Quser;
    this.Counter++;
    // Stop the stream after 100 reads and emit the data
    if (this.Counter === 100) {
        this.emit('completed', this.Qbase, this.Quser);
    }
    // do some calcs on this.Qbase

    this.push('something not important');
    callback();
};
// export the object
module.exports = TransformStream;

Answer 1

修改

另外，我不知道你的计数器有多高，但是如果你填满缓冲区，它将停止将数据传递给变换流，在这种情况下completed永远不会被实际命中，因为你永远不会反限制。尝试更改highwatermark。

编辑2：更好的解释

众所周知，transform stream 是双工流，这基本上意味着它可以接受来自源的数据，并且可以将数据发送到目的地。这通常分别称为读写。 transform stream继承自Node.js实施的read stream和write stream。但有一点需要注意，transform stream 不必实现_read或_write函数。在这种意义上，您可以将其视为鲜为人知的passthrough stream。

如果您考虑transform stream实现write stream这一事实，您还必须考虑写入流始终具有转储其内容的目标这一事实。您遇到的问题是，当您创建transform stream时，您无法指定发送内容的位置。 将数据完全传递到转换流的唯一方法是将其传输到写入流，否则，实质上您的流会被备份并且无法接受更多数据，因为数据没有位置去吧。

这就是为什么当你管道到写入流时它始终有效。写入流通过将数据发送到目的地来减轻数据备份，因此所有数据都将通过管道输送，并且将发出完成事件。

当样本量很小时，代码在没有写入流的情况下工作的原因是您没有填充流，因此转换流可以接受足够的数据以允许完整的事件/阈值击中。随着阈值的增加，您的流可以接受而不将其发送到另一个地方（写入流）的数据量保持不变。这会导致您的流备份，并且它不再接受数据，这意味着永远不会发出已完成的事件。

我冒昧地说，如果你为变换流增加highwatermark，你将能够提高你的门槛并且仍然可以使用代码。但这种方法不正确。将您的流传输到写入流，该写入流将数据发送到dev / null，以创建写入流的方式：

var writer = fs.createWriteStream('/dev/null');

buffering上Node.js文档中的部分解释了您遇到的错误。

Answer 2

你不会打断_transform并且进程远在很远的地方。尝试：

this.emit('completed', ...);
this.end();

这就是'程序似乎在返回结果之前终止的原因

并且不输出任何无用的数据：

var wstream = fs.createWriteStream('/dev/null');

祝你好运）

Answer 3

我建议使用Writable而不是变换流。然后将_transform重命名为_write，如果您输入流，您的代码将使用该流。正如@Bradgnar已经指出的那样，转换流需要一个消费者，或者它将stop the readable流将更多数据推送到其缓冲区。

Node.js Streams可读取转换

3 个答案: