我想要一个php示例代码将我的pdf转换为html输出
生病尝试所有的解决方案,但没有找到满足我的要求的解决方案。
生病只想要从pdf到html的相同输出
先谢谢
答案 0 :(得分:0)
1)将.exe文件下载并解压缩到一个文件夹: http://sourceforge.net/projects/pdftohtml/
2)创建一个.php文件,并输入此代码(假设pdftohtml.exe位于该文件夹中,源sample.pdf也是如此):
<?php
$source_pdf="sample.pdf";
$output_folder="MyFolder";
if (!file_exists($output_folder)) { mkdir($output_folder, 0777, true);}
$a= passthru("pdftohtml $source_pdf $output_folder/new_file_name",$b);
var_dump($a);
?>
3)输入 MyFolder ,您将看到转换后的文件(取决于页数..)
P.S。我不知道,但也存在许多商业或试用api。
来自here
的@ T.Todua的解决方案答案 1 :(得分:0)
<?php
$c = curl_init();
$cfile = curl_file_create('test.pdf', 'application/pdf');
$apikey = 'YOUR_API_KEY'; // from https://pdftables.com/api
curl_setopt($c, CURLOPT_URL, "https://pdftables.com/api?key=$apikey&format=html");
curl_setopt($c, CURLOPT_POSTFIELDS, array('file' => $cfile));
curl_setopt($c, CURLOPT_RETURNTRANSFER, true);
curl_setopt($c, CURLOPT_FAILONERROR,true);
curl_setopt($c, CURLOPT_ENCODING, "gzip,deflate");
$result = curl_exec($c);
if (curl_errno($c) > 0) {
print('Error calling PDFTables: '.curl_error($c).PHP_EOL);
} else {
// save the HTML we got from PDFTables to a file
file_put_contents ("test.html", $result);
}
curl_close($c);
?>