PHP中的PDF到HTML和HTML到PDF的解决方案

时间:2016-01-26 06:34:58

标签: php html pdf html-to-pdf pdf-to-html

我需要将PDF文档转换为HTML,然后在编辑html后我将此HTML转换为PDF。 我使用' pdftohtml' ubuntu命令(pdftohtml - 将pdf文件转换为html,xml和png图像的程序),如下面的PHP代码

<?php $output = shell_exec('pdftohtml create.pdf updated.html'); ?>

它成功转换整个文档,但它会传递页面顶部的所有图像。 谁能帮我做这个工作?

1 个答案:

答案 0 :(得分:0)

  • 您可以使用“-layout”标志从转换后的PDF文件中的原始html文件中保留文档的布局(页眉,页脚,分页等)。

    $output = shell_exec('pdftohtml -layout create.pdf updated.html');
    
  • 如果您只想转换PDF文件中的一系列页面,请使用“-f”和“-l”(小写“L”)标志来指定第一个和最后一个您要转换的范围内的页面。

    $output = shell_exec('pdftohtml -f 5 -l 9 create.pdf updated.html');
    
  • 要转换使用所有者密码保护和加密的PDF文件,请使用“-opw”标志(标志中的第一个字符是小写字母“O”,而不是零)

    $output = shell_exec('pdftohtml -opw ‘password’ create.pdf updated.html');
    

Source