Question

我需要在PHP应用程序中分析几个PDF文件的注释和书签。有没有办法提取这些信息？

我需要的只是书签名称+层次结构和评论内容+坐标。

我更喜欢PHP库，但我也可以在服务器上安装其他软件并使用exec（）调用它。

Answer 1

好的，https://github.com/smalot/pdfparser似乎能够提取书签和注释。至少它提供了一个包含所需数据的巨大数组。

$parser = new \Smalot\PdfParser\Parser();
$pdf    = $parser->parseFile('document.pdf');

print_r($pdf->getObjects());

我现在要做的就是找出如何处理这个数组......