我发现用于使用PDFJS提取文本的早期版本的代码不再适用于最新版本的PDFJS。以下是一些以前的版本
Extract text from pdf file using javascript
how to correctly extract text from a pdf using pdf.js
extract text from pdf in Javascript
有没有人有当前有效的代码?
答案 0 :(得分:0)
迭代getTextContent()的返回值。
pdfDoc.getPage(1).then((p) => {
p.getTextContent().then((textContent) => {
// Iterate here
});
});