我是python新手,下面是我的代码,该代码提取了pdf的全部内容。但是我需要提取特定数据。 例如:pdf有10个公司名称,每个名称都有一些详细信息。我们必须以这样的方式进行编码:在我们的代码中,我们在列表中包含公司名称。如果该名称与pdf中的公司名称匹配,则应提取相应公司名称的详细信息。
import PyPDF2 as py
pdf = open('C:/Users/nagamit/Desktop/2018 Q4 - Quarterly Financial Report - Green Equity Investors V.pdf','rb')
text = py.PdfFileReader(pdf)
page1 = text.getPage(0)
print(page1.extractText())
i=0
while i < text.getNumPages():
page = text.getPage(i)
print(page.extractText())
i=i+1
有人可以帮我解决这个问题吗?