我需要将格式化的pdf和word文档转换为html。此转换用于将文档显示到Web浏览器中。进入Web浏览器,您还可以选择文本。我不知道在后端(例如Java)或者php或者有一个jquery / javascript插件是否更好?
我的目标是在iPaper等网络浏览器中显示这些文档。
感谢您的帮助
答案 0 :(得分:0)
您可以使用pdftohtml自动运行服务器端,也可以使用它批量处理您的pdf文件。
答案 1 :(得分:0)
这是我正在进行精炼的PowerShell解决方案:
https://github.com/suzumakes/ReplaceIT
如果您遇到的问题是Word吐出大量垃圾并声称它是一个HMTL文件,这应该会有很大帮助。有一个原因,iPaper拥有如此庞大的团队,而这是因为您正在寻找从文档构建网页,只需单击按钮即可打印到网络,然后转动这很难。