使用PHP从PDF中提取评论和书签等元数据

时间:2017-03-08 11:06:54

标签: php pdf

我需要在PHP应用程序中分析几个PDF文件的注释和书签。 有没有办法提取这些信息?

我需要的只是书签名称+层次结构和评论内容+坐标。

我更喜欢PHP库,但我也可以在服务器上安装其他软件并使用exec()调用它。

1 个答案:

答案 0 :(得分:0)

好的,https://github.com/smalot/pdfparser似乎能够提取书签和注释。至少它提供了一个包含所需数据的巨大数组。

$parser = new \Smalot\PdfParser\Parser();
$pdf    = $parser->parseFile('document.pdf');

print_r($pdf->getObjects());

我现在要做的就是找出如何处理这个数组......