使用Node查找PDF页面计数(在Windows上)

时间:2015-05-08 19:16:16

标签: javascript node.js pdf phantomjs pdf.js

我做了很多研究(我觉得还不够?)并且我正在尝试使用Node.js找到一个易于使用的库来查找PDF的页数。该库需要在Windows操作系统上可用。

任何人都知道如何最好地接近这个?在最糟糕的情况下,我正在考虑使用PhantomJS和PDF.js库。

感谢您的帮助!!

2 个答案:

答案 0 :(得分:5)

由于它是基于pdf.js构建的,pdf2json它应该在Windows中运行。

我设法找到了测试文档的页数,如下所示:

var PDFParser = require('pdf2json');
var pdfParser = new PDFParser();

pdfParser.on('pdfParser_dataReady', function(data) {
    var doc = data.PDFJS && data.PDFJS.pdfDocument && data.PDFJS.pdfDocument.numPages;
    console.log('Number of pages:', doc);
});
// pdfParser.on('pdfParser_dataError', _.bind(_onPFBinDataError, self));

pdfParser.loadPDF('test.pdf');

答案 1 :(得分:0)

在当前版本中,您可以通过 pdf2json 的 Pages 数组获取总页数:

stream.pipe(new PDFParser())
  .on('pdfParser_dataReady', (data) => {
    const pageCount = data && data.formImage && data.formImage.Pages && data.formImage.Pages.length ? data.formImage.Pages.length : 0;
    console.log(pageCount);
  })