某些字母(例如fl,ff,fi)未在python中使用pypdf2提取
我正在使用pypdf2模块来解析python中的PDF。
from PyPDF2 import PdfFileReader
with open('C:\\path\\file.pdf', 'rb') as f:
reader = PdfFileReader(f)
contents = reader.getPage(0).extractText()
print(contents)
没有错误。该代码可以正常工作,但不会解析fl,ff,fi字母。