格式化的Pdf字到html

时间:2012-07-02 16:43:31

标签: java php html pdf ms-word

我需要将格式化的pdf和word文档转换为html。此转换用于将文档显示到Web浏览器中。进入Web浏览器,您还可以选择文本。我不知道在后端(例如Java)或者php或者有一个jquery / javascript插件是否更好?

我的目标是在iPaper等网络浏览器中显示这些文档。

感谢您的帮助

2 个答案:

答案 0 :(得分:0)

您可以使用pdftohtml自动运行服务器端,也可以使用它批量处理您的pdf文件。

答案 1 :(得分:0)

这是我正在进行精炼的PowerShell解决方案:

https://github.com/suzumakes/ReplaceIT

如果您遇到的问题是Word吐出大量垃圾并声称它是一个HMTL文件,这应该会有很大帮助。有一个原因,iPaper拥有如此庞大的团队,而这是因为您正在寻找从文档构建网页,只需单击按钮即可打印到网络,然后转动这很难。