我需要在PHP应用程序中分析几个PDF文件的注释和书签。 有没有办法提取这些信息?
我需要的只是书签名称+层次结构和评论内容+坐标。
我更喜欢PHP库,但我也可以在服务器上安装其他软件并使用exec()调用它。
答案 0 :(得分:0)
好的,https://github.com/smalot/pdfparser似乎能够提取书签和注释。至少它提供了一个包含所需数据的巨大数组。
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('document.pdf');
print_r($pdf->getObjects());
我现在要做的就是找出如何处理这个数组......