Question

我已经使用PyPDF2创建了一个PDF Splitter。它将大小超过20Mb的PDF拆分为多个较小的PDF。

我使用的逻辑是将所有页面拆分为单页PDF，找到每个页面的大小。添加大小，直到达到20 Mb并拆分。

我面临的问题是PDF中某些页面的大小几乎与原始PDF相同。虽然当我手动进行页面提取时，大小约为500Kb。

不确定尺寸为什么会增加。请帮助我解决这些问题。

for i in range(pdf_reader.numPages):
    # New PDF with each page
    outputpdf = newpath + '\\' + pp.split('.pdf')[0] + 'page' + str(i+1) +'.pdf'

    #PDF Writer

    output = PyPDF2.PdfFileWriter()

    #Writing each page to PDF Writer

    output.addPage(pdf_reader.getPage(i))

    #Write into the new PDF

    with open(outputpdf, "wb") as outputStream:

         output.write(outputStream)

Answer 1

经过多次尝试和错误，我找到了答案。我使用pdfrw库而不是PyPDF2提取每个页面，而且我不再面临相同的问题。

PDF页面拆分-PDF大小增加

1 个答案: