将PDF转换为HTML

时间:2012-01-16 22:38:02

标签: php html pdf

  

可能重复:
  Convert PDF to HTML

我需要将以PDF格式上传的简历转换为HTML。我已经使用livedocx.com转换doc和docx格式,但它们不支持从PDF转换。我已经阅读了关于此问题的堆栈溢出的其他帖子,标准解决方案是安装pdf2html命令行工具。这不是我的选择,因为这是一个我不是管理员的共享托管服务器。主机不会通过安装该工具来帮助我,所以我要么需要第三方服务,要么用一种干净的方式来使用本机PHP。在最新的CentOS上运行的PHP版本为5.2。请帮忙!

克里斯

2 个答案:

答案 0 :(得分:1)

CentOS默认安装pdftohtml。这是要使用的工具。如果由于某种原因您的托管服务提供商已删除它,那么您需要重新安装它。最好的办法是通过os的包管理器安装它。如果您有ssh访问权限,请登录并使用以下命令安装:

yum install poppler-utils

如果您没有ssh访问权限且服务提供商不愿意为您安装, 猜测唯一的选择是找到一个类似于你用于doc / docx的web服务。不知道'一个好人',但这就是谷歌的目的。

答案 1 :(得分:0)

另一个不太优雅的解决方案是使用ghostscript(更有可能预先安装)将PDF转换为PNG图像,然后显示这些图像。这样做的好处是能够处理更多的PDF文件,并且布局将保持完美,但它将是所有图像。