标签: python pdf text adobe data-conversion
我想将许多 PDF文件转换为txt文件。我用python代码尝试了两种不同的方式。它们可以工作,但是文件格式很差,以后我再也不能真正使用它们了。
当我使用 Adobe Acrobat Reader 中的“导出为.txt”选项时,可以得到格式精美的完美结果。是否可以在Python程序中使用Adobe Reader Function或“复制” Acrobat转换PDF的方式?
格式欠佳的两个结果来自 PDFMiner和PyPDF2。