使用pdfminer3k进行不完美的解析

时间:2017-07-25 01:24:29

标签: python python-3.x

我正在尝试将.pdf文件转换为.txt文件, 但是我遇到了问题。 这是我的python代码。

for i in flist:
    newFile = ''
    if i.endswith('py'): continue
    if i.find('.h') != -1:
        newFile = i.replace('.h.pdf','.h')
    else:
        newFile = i.replace('.pdf','.txt') 
    os.system("python pdf2txt.py -o %s %s" % (newFile, i))

此代码将pdf文件转换为txt文件,但是, 输出txt文件未完全解析。 你知道为什么它解析得不完美吗?

0 个答案:

没有答案