node.js pdf2json如何解析数组中的PDF?

时间:2017-06-11 13:14:07

标签: node.js

我使用节点版本7.10.0:

pdf2json版本1.1.7 邮件解析器版本2.0.5 smtp-server版本3.0.1

我收到了一封带有PDF附件的电子邮件,我想使用pdf2json解析PDF而不将PDF保存到磁盘,我有来自电子邮件附件的字节数组。如何直接将其解析到模块?

我以为我可以这样做:

    const pdfParser     = require("pdf2json");

    let objPDF = new pdfParser();
    objPDF.parseBuffer(arybytContent);

arybytContent'是来自邮件附件的内容:

    arybytContent = objAttachment["content"]["data"];

使用Chrome查看objPDF,看起来内容是否已正确解析,是否正确使用了该类?

1 个答案:

答案 0 :(得分:0)

问题在于以我的方式分配数据会导致数据"数据"作为一个字节数组返回,这与parseBuffer方法所期望的完全不同,因此解决方案是将数组转换为缓冲区:

    new Buffer(objAttachement["content"]["data"]);

然后可以将其传递给" parseBuffer"方法