使用PyPDF2或Pdfminer从pdf中提取URLS,BOOKMARKS,MARKUP和注释

时间:2018-04-17 22:45:45

标签: python python-3.x pdfminer pypdf2

我尝试使用pypdf2或pdfminer从pdf中提取pdf网址,评论或bookmarsk。即使pdf中有url或bookmarsk,我也看不到/ Annots或URI。

1 个答案:

答案 0 :(得分:0)

使用PyMuPDF我能够从pdf中提取链接和书签。 如何安装PyMuPDF 1. pip安装PyMuPDF 有直接的方法从pdf中提取书签和超链接。 请参阅以下文档链接。 http://pymupdf.readthedocs.io/en/latest/tutorial/#inspecting-the-links-of-a-page http://pymupdf.readthedocs.io/en/latest/tutorial/#working-with-outlines

如果有人知道如何从pdf中提取评论和标记,请告诉我们?