使用Python解析PDF文件

时间:2018-08-08 21:40:23

标签: javascript python pdf pdf.js

(1)是否可以使用Python搜索pdf文件中的文本并转到pdf文件中的该位置? (2)有没有一种方法可以突出显示pdf文件中的文本,然后使用Python提取该文本?

我尝试使用Javascript pdf.js,该方法实际上有效,但是我想尝试Python。任何帮助,将不胜感激。谢谢!

1 个答案:

答案 0 :(得分:1)

要在PDF文件中搜索文本,可以使用PyMuPDFpdfminer。 PyMuPDF还可让您创建PDF查看器,并在需要时突出显示文本。