如何使用pymupdf从PDF提取特定数据?

时间:2019-12-25 14:42:50

标签: python

我是python新手,下面是我的代码,该代码提取了pdf的全部内容。但是我需要提取特定数据。 例如:pdf有10个公司名称,每个名称都有一些详细信息。我们必须以这样的方式进行编码:在我们的代码中,我们在列表中包含公司名称。如果该名称与pdf中的公司名称匹配,则应提取相应公司名称的详细信息。

import PyPDF2 as py

pdf = open('C:/Users/nagamit/Desktop/2018 Q4 - Quarterly Financial Report - Green Equity Investors V.pdf','rb')

text = py.PdfFileReader(pdf)

page1 = text.getPage(0)

print(page1.extractText())

i=0

while i < text.getNumPages():
    page = text.getPage(i)
    print(page.extractText())
    i=i+1

有人可以帮我解决这个问题吗?

0 个答案:

没有答案