我有一个nodejs文件,在这里我从文件(主要是pdf和docx文件)中读取数据。数据是在文件读取损坏后发生的,实际上它不是人类可读的形式。
var myReadStream = fs.createReadStream('./public/docs/'+req.file.filename);
myReadStream.setEncoding('UTF8');
var rContents = '' // to hold the read contents;
myReadStream.on('data', function(chunk) {
rContents += chunk;
});
myReadStream.on('error', function(err){
console.log(err);
});
myReadStream.on('end', async function(){
console.log(rContents); //its prints unreadable output
});
输出将如下所示:
�(����j�0E����Ѷ�J�(��ɢ�eh��4ND�B�����81�$14�� ��{�1��ښl �w%�=���^i7+���-d&�0�A�6�l4��L60#�Ò�S
O����X��*��V$:�B~���^�K����ڃ
/P��I��~7$��i��J&B0Z�Du�t�OJ�K(H����xG
�L�+�v����dcӻ���W>*��\XR�mp���Z}����HwnM�V��n���-�")/�ZwB`���4��� ��s�DX���j��;A*ʝ����c�֝��4���[�S