如果以前曾经问过这个道歉,但我找不到我想要做的事情。我有一个大型PDF,包含一批100个2页的表单(每个表单都有一个唯一的标识符)。我想将其拆分,以便1-2页在新文件中,3-4在新文件中,依此类推。如何编辑以下代码以实现此目的?目前,它将每个单独的页面拆分为单独的文件。
from pyPdf import PdfFileWriter, PdfFileReader
inputpdf = PdfFileReader(file("abc.pdf", "rb"))
for i in range(inputpdf.numPages):
output = PdfFileWriter()
output.addPage(inputpdf.getPage(i))
outputStream = file("abc-page%s.pdf" % i, "wb")
output.write(outputStream)
outputStream.close()
答案 0 :(得分:2)
我认为这就是你想要的。我还没有验证它,YMMV等。
from pyPdf import PdfFileWriter, PdfFileReader
inputpdf = PdfFileReader(file("abc.pdf", "rb"))
for i in range(inputpdf.numPages // 2):
output = PdfFileWriter()
output.addPage(inputpdf.getPage(i * 2))
if i * 2 + 1 < inputpdf.numPages:
output.addPage(inputpdf.getPage(i * 2 + 1))
outputStream = file("abc-page%s.pdf" % i, "wb")
output.write(outputStream)
outputStream.close()