如何在PHP中将PDF文件转换为HTML?有没有lib或web服务?我的意思是免费的,谢谢!
答案 0 :(得分:3)
Google pdf2html,pdftohtml看起来是唯一可行的。它基于命令行程序,而不是PHP。所以它可能对你没用。 Google有能力进行转换,因此可能还有一种方法可以使用GDocs。虽然我不确定。无论如何,我希望至少让你走上正确的道路。
答案 1 :(得分:2)
我尝试过Poppler的pdftohtml命令将PDF文件转换为HTML文件。 Check it out on Poppler的HTML文件输出在使用时较轻,但输出不是很准确。
如果您想要准确的输出,您应该use pdf2htmlEX我已经转换了复杂的PDF文件并获得了最佳的HTML输出。
答案 2 :(得分:-1)
你不能。
PDF是包含嵌入字体,矢量图形和布局信息的复杂文档,无法以自动方式在HTML中表示。您可以提取文档的TEXT,但就是这样。