使用python编辑PDF格式的文本

时间:2018-06-07 13:25:27

标签: python python-2.7 data-analysis pypdf2

我有一个pdf文件,我需要在pdf中编辑一些文本/值。例如,在我有“BIRTHDAY DD / MM / YYYY”的pdf中总是“N / A”。我想将它改为我想要的任何值,然后将其保存为新文档。覆盖现有文档也没问题。

到目前为止我以前做过这个:

import PyPDF2
pdf_obj = open('abc.pdf', 'rb')
pdf_reader = PyPDF2.PdfFileReader(pdf_obj)
page = pdf_reader.getPage(0)

writer = PyPDF2.PdfFileWriter()
writer.addPage(pdf_reader.getPage(0))
pdf_doc = writer.updatePageFormFieldValues(pdf_reader.getPage(0), {'BIRTHDAY DD/MM/YYYY': '123'})
outfp = open("new_abc1.pdf", 'wb')
writer.write(outfp)
outfp.close()

但是这个updatePageFormFieldValues()没有改变所需的值,可能是因为这不是表单字段?

screenshot of pdf showing the value to be changed

任何线索?

0 个答案:

没有答案