我需要将PDF文档转换为HTML,然后在编辑html后我将此HTML转换为PDF。 我使用' pdftohtml' ubuntu命令(pdftohtml - 将pdf文件转换为html,xml和png图像的程序),如下面的PHP代码
<?php $output = shell_exec('pdftohtml create.pdf updated.html'); ?>
它成功转换整个文档,但它会传递页面顶部的所有图像。 谁能帮我做这个工作?
答案 0 :(得分:0)
您可以使用“-layout”标志从转换后的PDF
文件中的原始html
文件中保留文档的布局(页眉,页脚,分页等)。
$output = shell_exec('pdftohtml -layout create.pdf updated.html');
如果您只想转换PDF
文件中的一系列页面,请使用“-f”和“-l”(小写“L”)标志来指定第一个和最后一个您要转换的范围内的页面。
$output = shell_exec('pdftohtml -f 5 -l 9 create.pdf updated.html');
要转换使用所有者密码保护和加密的PDF
文件,请使用“-opw”标志(标志中的第一个字符是小写字母“O”,而不是零)
$output = shell_exec('pdftohtml -opw ‘password’ create.pdf updated.html');