我想使用Python编辑pdf文件中的一些信息。我尝试使用Pypdf2从pdf文件中提取文本,但无法进行编辑。 以前有人对此进行过工作吗?
答案 0 :(得分:1)
我刚刚开始进行类似的操作(自动编辑电子邮件地址和电话号码,随着我的女友在学校工作,并且目前正在手动完成所有操作,然后会对其进行进一步的手动编辑),今天早上的概念证明。我利用了这个库:
https://github.com/JoshData/pdf-redactor
通过更改示例以使其具有适合电子邮件的正则表达式,并将替代文本更改为“已编辑的电子邮件”,我在几分钟内将其启动并运行。显然,还有很多事情要做,但是在我看来,pdf redactor会承担很多繁重的任务-对您来说这可能是一个很好的起点吗?
答案 1 :(得分:0)
如果您知道要编辑的信息在页面上的何处,https://github.com/KolbyFlipper/pdfRedact/将一次处理整个PDF目录