将PDF转换为文本而不会丢失格式

时间:2019-11-06 19:18:12

标签: python pdf text adobe data-conversion

我想将许多 PDF文件转换为txt文件。我用python代码尝试了两种不同的方式。它们可以工作,但是文件格式很差,以后我再也不能真正使用它们了。

当我使用 Adob​​e Acrobat Reader 中的“导出为.txt”选项时,可以得到格式精美的完美结果。是否可以在Python程序中使用Adobe Reader Function或“复制” Acrobat转换PDF的方式?

格式欠佳的两个结果来自 PDFMiner和PyPDF2。

0 个答案:

没有答案