我目前正在开发一个Copy/Transfer a sentence/paragraph from a PDF file to my program
的应用程序。我正在使用Javascript来开发我的程序,但我还没有发现如何阅读PDF文件。
我想知道如何将句子/段落从PDF文件复制/转移到我的程序中?
感谢。
答案 0 :(得分:7)
我知道这个问题已经过时了,但是如果你发现PDF.js太复杂了,npm install
pdfreader。 (我写了那个模块)
从PDF文件中提取文本需要5行代码:
var PdfReader = require("pdfreader").PdfReader;
new PdfReader().parseFileItems("sample.pdf", function(err, item){
if (item && item.text)
console.log(item.text);
});
答案 1 :(得分:4)
查看PDF.js,这是一个常用的JavaScript库,其中包含许多PDF操作方法。
查看this answer,了解如何使用pdf.js提取文字。