如何使用javascript计算PDF中的单词数量

时间:2018-04-06 14:44:49

标签: javascript pdf adobe words

我正在尝试使用javascript计算上传的PDF文件的字数。在研究这个主题时,我发现使用Adobe Acrobat的内置javascript函数 getPageNumWords()可以实现这一点。但是我不明白如何将此功能导入我的javascript项目,因为我只发现人们在Adobe Acrobat的控制台中使用它们。

甚至可能吗?如果没有,是否有另一种方法可以使用javascript计算PDF文件中的单词数量?

1 个答案:

答案 0 :(得分:2)

您可以使用javascript

将PDF.js用于PDF中的单词计数
var PdfReader = require("pdfreader").PdfReader;
new PdfReader().parseFileItems("your.pdf", function(err, item){
  if (item && item.text)
   console.log(item.text.split(' ').length);
});

了解更多信息https://github.com/mozilla/pdf.js