因此,我在从GET请求解析PDF文件时遇到问题,我使用pdf2text lib。
我可以正常从文件路径解析文件:
var pdfText = require('pdf2Text');
var fs = require('fs');
var buffer = fs.readFileSync('C:/myPdf.pdf');
pdfText(buffer).then(function(result){
// do some stuff with the result here
})
但我不确定如何从HTTP请求中获取缓冲区,我尝试执行new Buffer(response)
但它没有工作(我使用请求承诺)顺便说一下图书馆)。请记住,我并不想保存文件,只需将其作为缓冲区读取即可。
request('http://blabla.com/pdfs/myPdf.pdf').then(function(response){
var buffer = new Buffer(response);
pdfText(buffer).then(function(result){
// doesn't work with this buffer
})
});
我想这对于请求承诺可能是不可行的,我应该使用标准请求,但我仍然不确定我应该做什么。