PDFPY将大型PDF拆分为多个页面文件

时间:2011-07-11 19:04:06

标签: python pdf

如果以前曾经问过这个道歉,但我找不到我想要做的事情。我有一个大型PDF,包含一批100个2页的表单(每个表单都有一个唯一的标识符)。我想将其拆分,以便1-2页在新文件中,3-4在新文件中,依此类推。如何编辑以下代码以实现此目的?目前,它将每个单独的页面拆分为单独的文件。

from pyPdf import PdfFileWriter, PdfFileReader
inputpdf = PdfFileReader(file("abc.pdf", "rb"))

for i in range(inputpdf.numPages):
  output = PdfFileWriter()
  output.addPage(inputpdf.getPage(i))
  outputStream = file("abc-page%s.pdf" % i, "wb")
  output.write(outputStream)
  outputStream.close()

1 个答案:

答案 0 :(得分:2)

我认为这就是你想要的。我还没有验证它,YMMV等。

from pyPdf import PdfFileWriter, PdfFileReader
inputpdf = PdfFileReader(file("abc.pdf", "rb"))

for i in range(inputpdf.numPages // 2):
    output = PdfFileWriter()
    output.addPage(inputpdf.getPage(i * 2))
    if i * 2 + 1 <  inputpdf.numPages:
        output.addPage(inputpdf.getPage(i * 2 + 1))
    outputStream = file("abc-page%s.pdf" % i, "wb")
    output.write(outputStream)
    outputStream.close()