应用错误收集

如何从pdf文件中提取特定单词并将其存储到excel中？

时间：2019-05-27 10:07:18

标签： python pdf text-extraction pypdf2 pdf-conversion

我无法从PDF文件中提取特定单词

http://www.careratings.com/upload/CompanyFiles/PR/Reliance%20Capital%20Ltd.-05-18-2019.pdf

import PyPDF2

pdf_file = open('Reliance Capital Ltd.-05-18-2019.pdf', 'rb')

read_pdf = PyPDF2.PdfFileReader(pdf_file)

number_of_pages = read_pdf.getNumPages()

page = read_pdf.getPage(0)

page_content = page.extractText()

print(page_content)

我想以excel格式提取公司名称，日期和第一个表格，但“金额”列除外，但我无法提取

0 个答案:

没有答案