提取文本,格式保存在PHP中

时间:2015-10-28 10:28:13

标签: php parsing pdf extraction

我正在使用pdfparser我想在php中从pdf中提取数据,以便保留所有空格。目前它只是从pdf中返回删除所有格式的字符串。

这就是我所做的

function extract_data($filename)
{
      $parser=new Smalot\PdfParser\Parser();
      $pdf=$parser->parseFile($filename);
      $text=$pdf->getText();
      return $text;
}

1 个答案:

答案 0 :(得分:3)

<强> $文本= nl2br($ PAGE-&GT;的getText());
echo $ text;
这可以通过用我提供的最后一行替换你的最后一行来轻松解决......