有没有办法在nodejs中一次读取一个符号而不将整个文件存储在内存中? 我找到了lines
的答案我试过这样的事情,但它没有帮助:
const stream = fs.createReadStream("walmart.dump", {
encoding: 'utf8',
fd: null,
bufferSize: 1,
});
stream.on('data', function(sym){
console.log(sym);
});
答案 0 :(得分:8)
可读流有一个read()方法,您可以在其中传递要读取的每个块的长度(以字节为单位)。例如:
var readable = fs.createReadStream("walmart.dump", {
encoding: 'utf8',
fd: null,
});
readable.on('readable', function() {
var chunk;
while (null !== (chunk = readable.read(1) /* here */)) {
console.log(chunk); // chunk is one byte
}
});
答案 1 :(得分:1)
这是一种较低级别的方式:fs.read(fd, buffer, offset, length, position, callback)
使用:
const fs = require('fs');
// open file for reading, returns file descriptor
const fd = fs.openSync('your-file.txt','r');
function readOneCharFromFile(position, cb){
// only need to store one byte (one character)
const b = new Buffer(1);
fs.read(fd, b, 0, 1, position, function(err,bytesRead, buffer){
console.log('data => ', String(buffer));
cb(err,buffer);
});
}
在阅读文件时,你必须增加位置,但它会起作用。
这是一个如何逐个字符地读取整个文件的快速示例
为了好玩,我写了这个完整的脚本来做,只是传入一个不同的文件路径,它应该工作
const async = require('async');
const fs = require('fs');
const path = require('path');
function read(fd, position, cb) {
let isByteRead = null;
let ret = new Buffer(0);
async.whilst(
function () {
return isByteRead !== false;
},
function (cb) {
readOneCharFromFile(fd, position++, function (err, bytesRead, buffer) {
if(err){
return cb(err);
}
isByteRead = !!bytesRead;
if(isByteRead){
ret = Buffer.concat([ret,buffer]);
}
cb(null);
});
},
function (err) {
cb(err, ret);
}
);
}
function readOneCharFromFile(fd, position, cb) {
// only need to store one byte (one character)
const b = new Buffer(1);
fs.read(fd, b, 0, 1, position, cb);
}
/// use your own file here
const file = path.resolve(__dirname + '/fixtures/abc.txt');
const fd = fs.openSync(file, 'r');
// start reading at position 0, position will be incremented
read(fd, 0, function (err, data) {
if (err) {
console.error(err.stack || err);
}
else {
console.log('data => ', String(data));
}
fs.closeSync(fd);
});
正如您所看到的,我们每次读取文件时都会增加位置整数。希望操作系统将文件保存在内存中。使用async.whilst()是可以的,但我认为对于更实用的样式,最好不要将状态保持在函数的顶部(ret和isByteRead)。我将把它作为练习留给读者来实现它而不使用那些有状态变量。