我正在尝试使用Python 3从PDF中提取事务数据作为一个简单的程序。我看到的是输出从第1页返回垃圾文本。这发生在特定的银行对帐单上,而其他PDF工作良好。
import PyPDF2
pdfFileObj = open('st1.pdf','rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
print(pdfReader.numPages)
pageObj = pdfReader.getPage(1)
print(pageObj.extractText())
6
EL @äKâKñøðð
{OOO {1}} {OOO {1}} {óóðøããèñ{1}} {UOO {1}} {奇数{1}}÷ùõøÖ¤£¢> - @äKâK@ ... †菲菲@ ...Œfifi- ...£N óøøðÅ¢Š†IŒfiñ
õùô`øòðð
不确定是否还有其他类似问题?或任何建议?