使用PDF.js将PDF静态转换为HTML

时间:2013-05-28 06:25:56

标签: javascript firefox pdf.js

PDF.js是Mozilla的最新库,是一个基于标准的PDF渲染器,完全用Javascript编写。目前,您无法访问生成的HTML,并且该库只能用作查看器。是否可以使用PDF.js将PDF静态转换为其HTML等价物?考虑到它在浏览器中渲染,它必须是HTML + CSS,而JS只能用于导航。

将其转换为HTML后,我计划使用现有的HTML工作流来导入/索引/使用该页面,就好像它是一个普通的HTML网页一样。

4 个答案:

答案 0 :(得分:15)

注意:这是针对原始问题的,以及可能正在访问此相关帮助的其他人,就像我一样。 ;)

答案:
您可以尝试:基于Poppler的Popplerpdf2htmlEX

我建议查看pdf2htmlEX documentation它也非常好comparison table

答案 1 :(得分:7)

pdf.js渲染到Canvas,因此无法用于将PDF静态转换为HTML

答案 2 :(得分:1)

DocPubPDFNet提供支持,这是一个支持C#的PDF SDK,支持将PDF转换为HTML离线。

来自同一家公司的

WebViewer是一个基于HTML5的PDF查看器,可以在浏览器中即时呈现文档。

  

WebViewer适用于所有主要的Web平台;可以在任何HTML5,Silverlight或Flash应用程序中直接嵌入和自定义查看器。内容可以从任何系统或设备即时访问 - 包括iPad / iPhone(iOS),Android,Windows(桌面和平板电脑),WP8,Linux,Mac等。demo

答案 3 :(得分:-1)

AccuSoft有一个名为Prizm的基于HTML5的PDF / DOC查看器。我不认为这可以将PDF静态转换为HTML,但它看起来像是一个基于HTML5的功能查看器。我没有经验,但在线HTML5演示(链接)看起来非常令人印象深刻。他们声称它可以在PC&移动可以很好地渲染这些文件。

  

Accusoft HTML5查看技术几乎可以在任何智能手机或平板电脑上通过本机浏览器显示几乎任何文档文件-DOC,PDF,PPT,CAD等数十种文档文件,而用户设备上无需其他应用程序或播放器。