我做了很多研究(我觉得还不够?)并且我正在尝试使用Node.js找到一个易于使用的库来查找PDF的页数。该库需要在Windows操作系统上可用。
任何人都知道如何最好地接近这个?在最糟糕的情况下,我正在考虑使用PhantomJS和PDF.js库。
感谢您的帮助!!
答案 0 :(得分:5)
由于它是基于pdf.js构建的,pdf2json它应该在Windows中运行。
我设法找到了测试文档的页数,如下所示:
var PDFParser = require('pdf2json');
var pdfParser = new PDFParser();
pdfParser.on('pdfParser_dataReady', function(data) {
var doc = data.PDFJS && data.PDFJS.pdfDocument && data.PDFJS.pdfDocument.numPages;
console.log('Number of pages:', doc);
});
// pdfParser.on('pdfParser_dataError', _.bind(_onPFBinDataError, self));
pdfParser.loadPDF('test.pdf');
答案 1 :(得分:0)
在当前版本中,您可以通过 pdf2json 的 Pages
数组获取总页数:
stream.pipe(new PDFParser())
.on('pdfParser_dataReady', (data) => {
const pageCount = data && data.formImage && data.formImage.Pages && data.formImage.Pages.length ? data.formImage.Pages.length : 0;
console.log(pageCount);
})