在node.js中一次读取一个文件?

时间:2015-05-07 09:14:03

标签: node.js stream

有没有办法在nodejs中一次读取一个符号而不将整个文件存储在内存中? 我找到了lines

的答案

我试过这样的事情,但它没有帮助:

const stream = fs.createReadStream("walmart.dump", {
    encoding: 'utf8',
    fd: null,
    bufferSize: 1,
});
stream.on('data', function(sym){
    console.log(sym);
});

2 个答案:

答案 0 :(得分:8)

可读流有一个read()方法,您可以在其中传递要读取的每个块的长度(以字节为单位)。例如:

var readable = fs.createReadStream("walmart.dump", {
    encoding: 'utf8',
    fd: null,
});
readable.on('readable', function() {
  var chunk;
  while (null !== (chunk = readable.read(1) /* here */)) {
    console.log(chunk); // chunk is one byte
  }
});

答案 1 :(得分:1)

这是一种较低级别的方式:fs.read(fd, buffer, offset, length, position, callback)

使用:

const fs = require('fs');

// open file for reading, returns file descriptor
const fd = fs.openSync('your-file.txt','r');

function readOneCharFromFile(position, cb){

        // only need to store one byte (one character)
        const b = new Buffer(1);

        fs.read(fd, b, 0, 1, position, function(err,bytesRead, buffer){
            console.log('data => ', String(buffer));
            cb(err,buffer);
        });

}

在阅读文件时,你必须增加位置,但它会起作用。

这是一个如何逐个字符地读取整个文件的快速示例

为了好玩,我写了这个完整的脚本来做,只是传入一个不同的文件路径,它应该工作

const async = require('async');
const fs = require('fs');
const path = require('path');


function read(fd, position, cb) {

    let isByteRead = null;
    let ret = new Buffer(0);

    async.whilst(
        function () {
            return isByteRead !== false;
        },
        function (cb) {
            readOneCharFromFile(fd, position++, function (err, bytesRead, buffer) {

                if(err){
                    return cb(err);
                }

                isByteRead = !!bytesRead;
                if(isByteRead){
                    ret = Buffer.concat([ret,buffer]);
                }

                cb(null);
            });
        },
        function (err) {
            cb(err, ret);
        }
    );

}


function readOneCharFromFile(fd, position, cb) {

    // only need to store one byte (one character)
    const b = new Buffer(1);
    fs.read(fd, b, 0, 1, position, cb);

}


 /// use your own file here
const file = path.resolve(__dirname + '/fixtures/abc.txt');
const fd = fs.openSync(file, 'r');

// start reading at position 0, position will be incremented
read(fd, 0, function (err, data) {
    if (err) {
        console.error(err.stack || err);
    }
    else {
        console.log('data => ', String(data));
    }
    fs.closeSync(fd);
});

正如您所看到的,我们每次读取文件时都会增加位置整数。希望操作系统将文件保存在内存中。使用async.whilst()是可以的,但我认为对于更实用的样式,最好不要将状态保持在函数的顶部(ret和isByteRead)。我将把它作为练习留给读者来实现它而不使用那些有状态变量。