我正在开发一个应用程序,其中pdf由" pdf.js"转换为html5。。项目要求是pdf.js呈现的html应该包含页面视图源中的pdf文本这样我们就可以对它进行进一步的处理。
我已阅读这篇文章http://www.codeproject.com/Articles/466362/Blend-PDF-with-HTML但它没有文字渲染选项。 这也是http://git.macropus.org/2011/11/pdftotext/example/
如果通过pdf.js转换为html5,如何以页面视图源中的div形式获取pdf中的文本?
答案 0 :(得分:0)
PDF.JS只提供一个文本层,它被添加到查看器顶部以使文本可以选择,它不会为图像和图形创建div - 这些文物被渲染到html5画布。