有没有办法使用php在pdf文件中获取链接? 当我上传pdf文件时,我希望获得要在数据库中插入的链接。
我使用过pdftotext,但此工具只返回纯文本。我需要获取pdf文件中的链接。
我在互联网上搜索,一无所获。
答案 0 :(得分:0)
您可以通过SetaPDF-Core组件访问链接注释(不是免费的,我与后面的公司有关)。您还可以修改链接目标,如链接演示中所示。
如果您还需要访问文本中的链接(或更好的网址),则可以使用已经提到的命令行工具sasfile="sasdata"
rwords="GROUP"
cat $sasfile | grep -iqw "$rwords"
或SetaPDF-Extractor组件(也不是免费的)。 SetaPDF-Extractor还附带一个演示,可根据找到的URL创建注释。