有没有办法通过Python突出显示给定单词的pdf文档?

时间:2013-09-09 00:45:36

标签: python pdf pdf-generation python-module

我之前有一些关键字,我想通过python搜索pdf文档并突出显示它们。是否可以使用像pdfMiner这样的库?

1 个答案:

答案 0 :(得分:1)

是的,您可以使用'PyMuPDF'库。 pip安装PyMuPDF。

然后使用以下代码,

import fitz

### READ IN PDF

doc = fitz.open(r"D:\XXXX\XXX.pdf")
page = doc[0]

text = "Amey"
text_instances = page.searchFor(text)

### HIGHLIGHT

for inst in text_instances:
    print(inst, type(inst))
    highlight = page.addHighlightAnnot(inst)


### OUTPUT

doc.save(r"D:\XXXX\XXX.pdf", garbage=4, deflate=True, clean=True)