如何使用php中的ghostscript从pdf中提取文本

时间:2017-03-17 17:15:52

标签: php pdf ghostscript

我正在尝试使用以下命令从pdf中提取文本,但它不起作用并返回null。

$text = shell_exec(gs -q -sDEVICE=txtwrite -dBATCH -dNOPAUSE -dFirstPage='.(int)$page_number.' -dLastPage='.(int)($page_number+1).' -sOutputFile=textfilename.txt exemple.pdf');

1 个答案:

答案 0 :(得分:1)

您没有字符串作为参数,您需要在将值传递给命令之前转义值。最后,您需要指定一个输出文件,在这种情况下,您希望数据转到STDOUT以供PHP访问。

$first_page = escapeshellarg((int)$page_number);
$last_page = escapeshellarg($page_number + 1);
$text = shell_exec("gs -q -sDEVICE=txtwrite -dBATCH -dNOPAUSE -dFirstPage=$first_page -dLastPage=$last_page -sOutputFile=%stdout exemple.pdf");