应用错误收集

我是python新手，下面是我的代码，该代码提取了pdf的全部内容。但是我需要提取特定数据。例如：pdf有10个公司名称，每个名称都有一些详细信息。我们必须以这样的方式进行编码：在我们的代码中，我们在列表中包含公司名称。如果该名称与pdf中的公司名称匹配，则应提取相应公司名称的详细信息。

import PyPDF2 as py

pdf = open('C:/Users/nagamit/Desktop/2018 Q4 - Quarterly Financial Report - Green Equity Investors V.pdf','rb')

text = py.PdfFileReader(pdf)

page1 = text.getPage(0)

print(page1.extractText())

i=0

while i < text.getNumPages():
    page = text.getPage(i)
    print(page.extractText())
    i=i+1

有人可以帮我解决这个问题吗？

如何使用pymupdf从PDF提取特定数据？

0 个答案: