使用PyPDF2

时间:2017-09-28 02:26:18

标签: python pypdf2

我正在尝试使用Python 3从PDF中提取事务数据作为一个简单的程序。我看到的是输出从第1页返回垃圾文本。这发生在特定的银行对帐单上,而其他PDF工作良好。

import PyPDF2

pdfFileObj = open('st1.pdf','rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
print(pdfReader.numPages)
pageObj = pdfReader.getPage(1)
print(pageObj.extractText())

6
   EL @äKâKñøðð {OOO {1}} {OOO {1}} {óóðøããèñ{1}} {UOO {1}} {奇数{1}}÷ùõøÖ¤£¢> - @äKâK@ ... †菲菲@ ...Œfifi- ...£N óøøðÅ¢Š†IŒfiñõùô`øòðð

不确定是否还有其他类似问题?或任何建议?

0 个答案:

没有答案